AI资讯新闻榜单内容搜索-模型训练

ICLR 2026｜CMU等团队让AI生成的3D场景真正「站得住」：PAT3D把文生3D从能看推进到能模拟、能交互

现在的 3D AIGC 已经可以很快生成场景，但离真正落地还有一段距离。很多场景看起来还行，一进物理模拟就会暴露问题，比如物体悬空、互相穿插，甚至还没碰就散。这些问题让它们很难直接用于游戏、XR 或机器人等实际场景。

来自主题: AI技术研报

8477 点击 2026-05-02 13:35

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

8947 点击 2026-05-01 13:13

腾讯混元CL-bench续作发布，让大模型读懂你的日常生活

在 AGI-Next 前沿峰会上，腾讯姚顺雨举了一个很生活化的例子：当你问 AI “今天吃什么” 时，真正限制答案质量的，可能不是模型不够大，也不是推理不够强，而是它不知道你今天冷不冷、想不想吃热的、最近和朋友聊过什么、家人又有什么偏好需要纳入考虑。

来自主题: AI技术研报

7064 点击 2026-05-01 13:12

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

基于视觉语言模型（VLM）的多智能体系统（MAS）正成为复杂多模态协作的核心方案，却被一个致命痛点死死卡住：多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大，早期细微错误最终演变成系统性崩溃。

来自主题: AI技术研报

7413 点击 2026-05-01 10:46

大模型“降智”真相，找到了

今天，智谱发布了一篇名为《Scaling Pain：超大规模Coding Agent推理实践》的技术报告，披露了GLM-5系列模型在Coding Agent场景下遇到的推理基础设施挑战与对应解法。

来自主题: AI技术研报

9504 点击 2026-04-30 13:52

ACL 2026｜答得更准还写得更短？华为泰勒实验室提出SHAPE，给LLM推理装了个「推理税」

来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了 SHAPE（Stage-aware Hierarchical Advantage via Potential Estimation），给推理链装上了一套「里程碑 + 推理税」机制——不仅告诉模型每一步推得对不对，还让它为啰嗦付出代价。结果是：准确率平均提升 3%，token 消耗直降 30%。

来自主题: AI技术研报

7926 点击 2026-04-30 12:12

ACL 2026｜Doc-V*：读100页文档不如只翻对5页，80页场景「暴打」RAG 10个点

Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出，一种从「静态阅读」到「主动探索」的多页文档理解新范式，通过交互式视觉推理让模型像人一样有策略地阅读长文档。

来自主题: AI技术研报

8505 点击 2026-04-30 09:00

openJiuwen社区首发「Coordination Enginnering」，让智能体从「单兵作战」到「精锐团队」

围绕 Coordination Engineering 这一下一跳工程范式，他们发布了一套完整的多智能体协同技术体系：Agent Team 实现团队自主协作，业界首发 Team Skills 沉淀协作经验，Team Skills Hub 打通共享生态，Team Skills 自演进驱动团队持续进化。

来自主题: AI资讯

7415 点击 2026-04-30 08:42

10万引普林斯顿刘壮最新访谈：架构没那么重要，数据才是王道

普林斯顿大学助理教授刘壮，在学术圈是一个颇为特殊的存在——他的每一篇论文几乎都在质疑某个“理所当然”的假设。架构真的重要吗？数据集真的足够多样吗？归一化层是必需的吗？大语言模型有世界模型吗？AI智能体能替代博士生吗？

来自主题: AI技术研报

8689 点击 2026-04-30 08:39

2026，Agent死于上下文失焦（附7大Claude Code 记忆遗忘与管理工具）

搭了个agent，结果该被记住的历史交互经验一点没记住，不该被记住的工具调用结果、过程输出被一股脑塞进上下文，导致输出质量下滑，类似的上下文失焦问题，这是多少人做agent时候的噩梦？

来自主题: AI技术研报

7620 点击 2026-04-30 08:35