AI资讯新闻榜单内容搜索-Mu

ICLR 2026｜CMU等团队让AI生成的3D场景真正「站得住」：PAT3D把文生3D从能看推进到能模拟、能交互

现在的 3D AIGC 已经可以很快生成场景，但离真正落地还有一段距离。很多场景看起来还行，一进物理模拟就会暴露问题，比如物体悬空、互相穿插，甚至还没碰就散。这些问题让它们很难直接用于游戏、XR 或机器人等实际场景。

来自主题: AI技术研报

8832 点击 2026-05-02 13:35

马斯克终于出庭！自曝每周工作100小时，OpenAI：他没分到钱酸了

据The Verge等多家外媒报道，今天凌晨，埃隆·马斯克（Elon Musk）与OpenAI CEO萨姆·奥尔特曼（Sam Altman）的世纪庭审在加州奥克兰联邦法院进入开庭陈词阶段。当天，马斯克身穿黑色西装、系黑色领带，出现在联邦法院。马斯克方、OpenAI方与微软方依次发表开庭陈词，随后马斯克作为本案第一证人进行举证。

来自主题: AI资讯

9180 点击 2026-04-30 09:28

AI「看不懂」、「做不好」视频的问题，混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script（MTSS），一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本"，通过 Stream Factorization 和 Relational Grounding 两大核心原则，让视频描述既忠实又可扩展，在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报

6889 点击 2026-04-28 09:57

一周1.2w Star，热门赛道杀出一匹黑马！对谈Multica张佳圆：如何重写“人A协作”规则？

张佳圆带着他的新产品 Multica 一周斩获 GitHub 1.2w Star回来了。这一次，他想探索的是：当 AI Agent 已经足够好，一个团队要怎么和多个 Agent 丝滑地协作？Multica 致敬的是 1964 年的操作系统 Multics——那个最终失败、但启发了 Unix 世界半个世纪的“多人、多任务”先驱。今天，它正在创造新的历史。

来自主题: AI资讯

9882 点击 2026-04-27 10:02

2秒钟转写5分钟音频！国产新语音模型拿下多项SOTA，定价骤减90%

阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景，在架构上引入Multi-Token Prediction（多Token预测）以提升推理效率，并通过扩展上下文窗口强化长内容识别能力。

来自主题: AI资讯

9747 点击 2026-04-25 10:22

扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋

今天上午，DeepSeek V4 发布，直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候，在训练层面看到了一个被大部分人滑过去的名词：Muon 优化器。

来自主题: AI技术研报

8976 点击 2026-04-25 10:12

营销已死，Anthropic 一个人干翻了整个市场部

694,000 次浏览。一篇 X Article，发布三天，将近 70 万阅读量。不是 Elon Musk 的推文，不是某家大公司的公告，是一个叫 GRITCULT 的账号，写的一篇叫《营销已死，Distribution Engineer 万岁》的长文。1.5K 点赞，235 次转发，55 条回复。

来自主题: AI资讯

6915 点击 2026-04-23 09:22