6款小游戏难倒所有顶级VLM!愤怒的小鸟让它们全军覆没,性能不如随机猜测
6款小游戏难倒所有顶级VLM!愤怒的小鸟让它们全军覆没,性能不如随机猜测首个系统性评估多模态大模型(VLM)交互式物理推理能力的综合基准来了。
首个系统性评估多模态大模型(VLM)交互式物理推理能力的综合基准来了。
在大模型研究领域,做混合专家模型(MoE)的团队很多,但专注机制可解释性(Mechanistic Interpretability)的却寥寥无几 —— 而将二者深度结合,从底层机制理解复杂推理过程的工作,更是凤毛麟角。
如何将情感价值落地转化为市场价值,是AI陪伴赛道面临的共性问题。
近年来,Stable Diffusion、CogVideoX 等视频生成模型在自然场景中表现惊艳,但面对科学现象 —— 如流体模拟或气象过程 —— 却常常 “乱画”:如下视频所示,生成的流体很容易产生违背物理直觉的现象,比如气旋逆向旋转或整体平移等等。
52个人,一款AI PPT工具,年入上亿美元。
谷歌这次真要甩王炸了!CEO劈柴两个神秘表情,或暗示Gemini 3.0下周登场。一句话秒生OS、UI网页,前端工程师看完集体沉默。三年追赶,成败就在此一举。
EverMind 团队近日宣布正式发布其旗舰产品 EverMemOS,这是一款面向人工智能智能体的世界级长期记忆操作系统。它旨在成为未来智能体的数据基础设施,为 AI 赋予持久、连贯、可进化的 “灵魂”。
奥特曼又又又亲自官宣了ChatGPT的一项“重要更新”——从现在起,你的ChatGPT可以听从指示,在输出内容中不再滥用破折号。为啥一个普通的标点符号,能让奥特曼亲自宣传,而且还极具热度呢?
人类的下一个分裂,从算法开始。 作者|Moonshot 编辑|靖宇 在生成式 AI 的早期叙事里,AI 大模型曾被描绘得理性、冷静、无偏见。 然而,不到三年时间,这个叙事迅速崩塌。事实正在变得越来越清
马斯克正以Grok为核心,在X与特斯拉双平台上狂飙推进xAI,从算力、数据到产品生态全面押注通往AGI的道路。在他眼中,AI既是人类最大风险也是最大机遇,他试图用「求真、不设禁忌」的开放路线与超大算力布局,抢占未来通用人工智能的制高点。