CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍
CVPR Oral | 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
4月29日圣何塞现场报道,今日,在2025英特尔代工大会(Intel Foundry Direct Connect)上,英特尔CEO陈立武携多位英特尔代工高管分享了多代核心制程和先进封装的技术进展、生态合作及未来战略,展露面向AI时代提供系统级代工的雄心。芯东西从大会前排发来一手报道。
随着大语言模型 (LLM) 技术的迅猛发展,基于 LLM 的智能智能体在客户服务、内容创作、数据分析甚至医疗辅助等多个行业领域得到广泛应用。
最近智谱竟然要上市了…但同样是在某小龙的朋友,在考虑跳槽回大厂了。“感觉卷不出来啊!”AI的未来是光明的,但自己的职业生涯可真不一定…
今天,在首届LlamaCon开发者大会上,Meta正式发布了对标ChatGPT的智能助手Meta AI App,并宣布面向开发者提供官方Llama API服务的预览版本。Meta AI App是一款智能助手,基于Llama模型打造,可通过社交媒体账号了解用户偏好、记住上下文。与ChatGPT一样,Meta AI App支持语音和文本交互,并额外支持了全双工语音交互(Full-duplex,
香港英文媒体《南华早报》29日援引两名知情人士的话报道称,微软研究院纽约实验室的高级研究员兰姆(Alex Lamb)将于即将到来的秋季学期加入新成立的清华大学人工智能学院(College of AI),担任助理教授。兰姆在一封电子邮件中证实了这一消息。
在太空行驶了 30 多万公里之后,数据服务公司 Lonestar 的“微型数据中心”进入了月球轨道。这台微型数据中心被搭载在一个名叫“雅典娜”的着陆器上。
AI洗脑人类,成功率6倍暴击!苏黎世大学在Reddit秘密实验引爆全网,LLM假扮多种身份,历时4个月发表1700+评论,轻松操控舆论,竟无人识破。
在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。
近来,纳米AI重磅上线MCP万能工具箱,全面支持MCP协议,开启AI Agent生产力新时代。作为国内首家开放生态MCP平台,它以超低门槛,让4亿人都能手搓爆款AI。