AI资讯新闻榜单内容搜索-涌现

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 涌现

为什么BF16的FlashAttention会把训练「炸掉」？清华首次给出机制解释，用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」？清华首次给出机制解释，用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」？清华首次给出机制解释，用极简改动稳住训练

一句话总结：社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了：在 BF16 等低精度训练里，FlashAttention 不是随机出 bug，而是会在特定条件下触发有方向的数值偏置，借助注意力中涌现的相似低秩更新方向被持续放大，最终把权重谱范数和激活推到失控，导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改，实测能显著稳定训练。

来自主题: AI技术研报

6902 点击 2026-03-04 13:49

GEO服务商「PureblueAI清蓝」完成数千万元天使轮融资，发布新AI营销数字员工平台 | 智能涌现首发

GEO服务商「PureblueAI清蓝」完成数千万元天使轮融资，发布新AI营销数字员工平台 | 智能涌现首发

GEO服务商「PureblueAI清蓝」完成数千万元天使轮融资，发布新AI营销数字员工平台 | 智能涌现首发

PureblueAI清蓝也同步发布了新产品——AI 营销数字员工平台mkter.ai，以及 AI 口碑营销数字员工“Mark”。

来自主题: AI资讯

9724 点击 2026-03-03 14:30

ICLR 2026｜在「想象」中进化的机器人：港科大×字节跳动Seed提出WMPO，在世界模型中进行VLA强化学习

ICLR 2026｜在「想象」中进化的机器人：港科大×字节跳动Seed提出WMPO，在世界模型中进行VLA强化学习

ICLR 2026｜在「想象」中进化的机器人：港科大×字节跳动Seed提出WMPO，在世界模型中进行VLA强化学习

香港科技大学 PEI-Lab 与字节跳动 Seed 团队近期提出的 WMPO（World Model-based Policy Optimization），正是这样一种让具身智能在 “想象中训练” 的新范式。该方法无需在真实机器人上进行大规模强化学习交互，却能显著提升策略性能，甚至涌现出自我纠错（Self-correction）行为。

来自主题: AI技术研报

9265 点击 2026-03-02 14:31

千问将发布AI眼镜、耳机、指环，巨头抢占AI新入口丨独家

千问将发布AI眼镜、耳机、指环，巨头抢占AI新入口丨独家

千问将发布AI眼镜、耳机、指环，巨头抢占AI新入口丨独家

《智能涌现》从阿里内部人士处获悉，阿里旗下个人AI助手“千问”将进入AI硬件领域，其在2026年规划的硬件形态包括AI眼镜、AI耳机、AI指环，将面向全球市场发售。

来自主题: AI资讯

9049 点击 2026-02-27 11:34

字节芯片，隐秘布局 | 智能涌现独家

字节芯片，隐秘布局 | 智能涌现独家

字节芯片，隐秘布局 | 智能涌现独家

随着豆包大模型和seedance视频生成模型等业务的爆发，自研芯片成功后，字节有望大大降低其算力成本。

来自主题: AI资讯

8621 点击 2026-02-13 12:12

星海图完成10亿元B轮融资，成第四家估值百亿具身智能创企｜智能涌现独家

星海图完成10亿元B轮融资，成第四家估值百亿具身智能创企｜智能涌现独家

星海图完成10亿元B轮融资，成第四家估值百亿具身智能创企｜智能涌现独家

CEO高继扬判断，2026年下半年，具身智能将进入 “成果验证”阶段。

来自主题: AI资讯

10360 点击 2026-02-11 15:24

前飞书表格技术负责人创业：用AI表格嵌入一切，“喂养”AI丨涌现新项目

前飞书表格技术负责人创业：用AI表格嵌入一切，“喂养”AI丨涌现新项目

前飞书表格技术负责人创业：用AI表格嵌入一切，“喂养”AI丨涌现新项目

AI表格更应该交由Agent使用，由AI最后交付结果，供人类审核。

来自主题: AI资讯

7390 点击 2026-02-11 14:37

Kimi海外收入已超国内，要做“Anthropic + Manus”｜独家

Kimi海外收入已超国内，要做“Anthropic + Manus”｜独家

Kimi海外收入已超国内，要做“Anthropic + Manus”｜独家

《智能涌现》获悉，近期Kimi在和投资人的沟通中表示，公司的海外收入已超过国内收入，新模型K2.5发布后，全球付费用户已有4倍增长。这一变化恰好发生在新一代模型K2.5发布后的短短几天内。

来自主题: AI资讯

9442 点击 2026-02-01 09:32

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

近日，香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索，只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作，还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”，甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯

9956 点击 2026-01-29 14:57

关于多模态大模型Token压缩技术进展，看这一篇就够了

关于多模态大模型Token压缩技术进展，看这一篇就够了

关于多模态大模型Token压缩技术进展，看这一篇就够了

近年来多模态大模型在视觉感知，长视频问答等方面涌现出了强劲的性能，但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ，带来极高的显存占用和延迟，限制了模型的可扩展性和本地部署。

来自主题: AI技术研报

9955 点击 2026-01-26 14:22

上一页当前第3页,共22页下一页