AI资讯新闻榜单内容搜索-多模态

化解机器人的「幻觉」：北大发布OmniManip，VLM结合双闭环系统，3D理解能力大幅提升

近年来视觉语⾔基础模型（Vision Language Models, VLMs）在多模态理解和⾼层次常识推理上⼤放异彩，如何将其应⽤于机器⼈以实现通⽤操作是具身智能领域的⼀个核⼼问题。这⼀⽬标的实现受两⼤关键挑战制约：

来自主题: AI技术研报

9208 点击 2025-01-23 13:09

6天连发6模型，阶跃稳稳蝉联多模态卷王

我勒个老天奶，大模型六小强之一的阶跃星辰，给大家拜早年的方式可真不一样——

来自主题: AI技术研报

5665 点击 2025-01-23 10:50

六小虎「阶跃星辰」疯狂了！连发6款大模型，多模态霸榜第一

提一个冷知识。

来自主题: AI资讯

8234 点击 2025-01-22 10:59

原生融合多模态上的突破，让商汤大模型打破Scaling Laws撞墙「魔咒」

下一代 AI 的发展，似乎遇到了难以逾越的瓶颈。去年 12 月，OpenAI 在 ChatGPT 两周年期间连续发布了 12 天，我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。

来自主题: AI资讯

8152 点击 2025-01-22 10:45

Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

来了来了，月之暗面首个「满血版o1」来了！这是除OpenAI之外，首次有多模态模型在数学和代码能力上达到了满血版o1的水平。

来自主题: AI资讯

9717 点击 2025-01-21 07:44

给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料

近期关于 scaling law 的讨论甚嚣尘上，很多观点认为 scale law is dead. 然而，我们认为，高质量的 “无监督” 数据才是 scaling law 的关键，尤其是教科书级别的高质量的知识语料。此外，尽管传统的语料快枯竭了，但是互联网上还有海量的视频并没有被利用起来，它们囊括了丰富的多种模态的知识，可以帮助 VLMs 更好好地理解世界。

来自主题: AI技术研报

8360 点击 2025-01-20 19:01