AI资讯新闻榜单内容搜索-Oral

CVPR 2026 Oral｜横扫室内3D场景，港科大（广州）打造单目开放词汇占据预测新SOTA

在具身智能研究中，如何让智能体精准理解周围环境的精细几何结构与开放语义信息，始终是具身感知的核心难题。近年来，语义占据预测（Semantic Occupancy Prediction）将稠密几何与语义信息统一到三维体素网格中，用于构建 3D 语义占据地图，为机器人的空间推理、导航与交互操作提供了场景表达基础。

来自主题: AI技术研报

10532 点击 2026-05-06 09:07

ICLR 2026 Oral | 没人诱导，大模型也会「骗人」

新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文，把视角放在了一个更贴近日常使用场景的问题上：人们更熟悉的，是用户故意诱导模型说假话的情形；而这篇工作真正追问的是，在没有刻意诱导、只是正常提问的情况下，模型会不会也出现某种 “表面这样答，实际那样想” 的现象。

来自主题: AI技术研报

7019 点击 2026-04-29 09:48

ICLR 2026 Oral｜Information Shapes Koopman Representation：信息如何决定世界模拟？

大多数世界模型工作默认：只要学到一个好的 latent dynamics，问题就解决了。但这个假设本身是可疑的——什么样的信息，才足以支撑一个可预测、可传播的动力学？本文从信息论出发，重新审视这一前提。

来自主题: AI技术研报

9559 点击 2026-04-23 09:20

ICLR发了Oral又反悔，理由是查到了制裁名单？

「学术铁幕！连 ICLR Oral 都给 desk-reject 了。」

来自主题: AI资讯

10164 点击 2026-04-21 10:22

ICLR 2026 Oral | 大道至简！斯坦福、英伟达、新国立联合推出InfoTok，用信息论重新定义高效视频分词

在生成式 AI 领域，视觉分词器（Visual Tokenizer）通常采用固定压缩率 —— 无论是单调的监控画面，还是复杂的动作大片，都被切分为等量的 Token。这种 "一刀切" 的做法不仅会造成巨大的计算冗余，也产生了 “信息量” 不同的 Token，不利于下游理解生成任务处理。

来自主题: AI技术研报

5955 点击 2026-03-31 10:03

4B模型幻觉抑制能力超越GPT-5，CMU等提出行为校准强化学习新方法

大语言模型（LLM）的幻觉问题一直是阻碍其在关键领域部署的核心难题。近日，研究人员提出了一种名为行为校准强化学习（Behaviorally Calibrated Reinforcement Learning）的新方法，通过重新设计奖励函数，让模型学会「知之为知之，不知为不知」。

来自主题: AI技术研报

8710 点击 2026-03-13 10:10

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式，递归似然比梯度优化器赋能扩散模型后训练

在 AI 视觉生成领域，扩散模型（DM）凭借其强大的高保真数据生成能力，已成为图像合成、视频生成等多模态任务的核心框架。然而，预训练后的扩散模型如何高效适配下游应用需求，一直是行业面临的关键挑战。

来自主题: AI技术研报

8152 点击 2026-03-10 09:30

ICLR2026 Oral | 当情感识别不再是分类题：EmotionThinker 让 SpeechLLM 学会“解释情绪”

SpeechLLM 是否具备像人类一样解释 “为什么” 做出情绪判断的能力？为此，研究团队提出了EmotionThinker—— 首个面向可解释情感推理（Explainable Emotion Reasoning）的强化学习框架，尝试将 SER 从 “分类任务” 提升为 “多模态证据驱动的推理任务”。

来自主题: AI技术研报

9130 点击 2026-02-25 14:28

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8295 点击 2026-02-12 14:56

ICLR 2026 Oral | DPO「只看总分不看细节」？TI-DPO用Token重要性重塑大模型对齐

在当今的大模型后训练（Post-training）阶段，DPO（直接偏好优化）凭借其无需训练独立 Reward Model 的优雅设计和高效性，成功取代 PPO 成为业界的「版本之子」，被广泛应用于 Llama-3、Mistral 等顶流开源模型的对齐中。

来自主题: AI技术研报

8208 点击 2026-02-11 13:58