帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈
帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。
在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。
Mistral沉默好久,果然在憋大招。
大家好,我是「沉浸式学AI」,专注于分享AI前沿技术与实战经验。2025年,要搭建一个真正“聪明又自主”的AI代理,离不开一整套“全家桶”式的开源工具——从大脑(推理、记忆),到肢体(浏览器、桌面操控),再到声音(语音交互),全流程打通。
如果用一句话为 2025 年写下注脚,那它不会是某个技术名词,而更像是一种哲学上的转变:“这一年,我们不再是孤立地使用软件,而是与智能的代理人(Agent)共舞,它们正悄然重塑我们的工作与生活。”
AI编程梦被撕碎!最新研究用57.6万个代码样本揭示:超20%代码依赖的是不存在的软件包。苹果、微软都曾中招,而Meta和微软还在高喊「未来AI写95%代码」。AI写代码的神话,正在变成安全灾难。
全世界最大的电脑展之一——COMPUTEX台北电脑展正式拉开了序幕。 COMPUTEX大会自创办以来已有43年历史,是亚洲最大、全球第二的ICT产业盛会,本届展会以“AI Next”为主题,汇聚全球超2000家科技巨头与创新企业,不仅拥有着琳琅满目的参展品牌和产品,更重要的是,那些全球顶级的上游厂商、存储厂商和PC厂商们都会在这里公布全新一代产品。
市场的大变革,孕育着大机会,创新者往往能够抓住机会、创造并引领未来。5 月 21 日,行业头部的一体化 HR SaaS 平台北森控股(股票代码:09669.HK)在北京隆重举办 “AI Learning 产品发布会”,宣布完成酷学院收购,并同步推出基于 AI 大模型的新一代学习平台 ——AI Learning
谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。
今年,Google算是打了个翻身仗。
2025 年以来,Agent 开发量和使用量都有明显提高。Agent 的爆发带来了 Agent Infra 需求的爆发。在过去 1-2 年,Agent 开发大多依赖开发者手动使用传统 Infra 搭建,开发工程量大、流程复杂,但随着越来越多 Agent-native Infra 涌现,Agent 开发的难度和周期都在缩小,开发的范式正在重构和收敛。