AI资讯新闻榜单内容搜索-模型

Scaling Law首次在自动驾驶赛道被验证！小鹏汽车CVPR演讲详解：AI「吃」下6亿秒视频后，智能涌现

CVPR 2025，自动驾驶传来重大进展： Scaling Law，首次在这条赛道被验证！

来自主题: AI资讯

9089 点击 2025-06-17 10:35

AI将受困于人类数据

AI迈入经验时代，2025 年 6 月 6 日，第七届北京智源大会在北京正式开幕，强化学习奠基人、2025年图灵奖得主、加拿大计算机科学家Richard S. Sutton以“欢迎来到经验时代”为题发表主旨演讲

来自主题: AI资讯

10404 点击 2025-06-17 10:26

细粒度视觉推理链引入数学领域，准确率暴涨32%，港中文MMLab打破多模态数学推理瓶颈

思维链（Chain of Thought, CoT）推理方法已被证明能够显著提升大语言模型（LLMs）在复杂任务中的表现。而在多模态大语言模型（MLLMs）中，CoT 同样展现出了巨大潜力。

来自主题: AI技术研报

10929 点击 2025-06-17 10:21

SFT+RL双管齐下：ReasonGen-R1如何破解文生图「指令不遵」难题？

近年来，链式推理和强化学习已经被广泛应用于大语言模型，让大语言模型的推理能力得到了显著提升。

来自主题: AI技术研报

8256 点击 2025-06-17 10:15

大模型“六小虎”人事动荡，半年12位高管离职

百川智能、零一万物、智谱核心高管出走，京东悄悄挖人。智东西6月16日报道，今年上半年，“大模型六小虎”中的智谱、MiniMax、零一万物、百川智能、阶跃星辰5家企业，共被曝13位AI高管变动，其中有12位出走、1位新入职

来自主题: AI资讯

11411 点击 2025-06-17 10:10

AI竟会看Prompt下菜！Vibe coding普通人vs程序员，剑桥最新报告

您有没有发现一个奇怪的现象：同样是Vibe coding，有些人轻松拿到完整的Flask应用，有些人却只得到几行if-else语句？剑桥大学计算机科学与技术系的研究者们最近发布了一项研究，用科学的方法证实了我们的直觉——AI确实会"看人下菜碟"。

来自主题: AI技术研报

9423 点击 2025-06-17 10:08

从"工具人"到"数字队友"：AI协作革命的最后一公里

从数字工具到数字队友的进化之路神译局是36氪旗下编译团队，关注科技、商业、职场、生活等领域，重点介绍国外的新技术、新观点、新风向。

来自主题: AI资讯

10295 点击 2025-06-17 10:05

搜索智能体RAG落地不佳？UIUC开源s3，仅需2.4k样本，训练快效果好

当前，Agentic RAG（Retrieval-Augmented Generation）正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中，搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面，部分方法优化的目标与真实下游需求存在偏离，另一方面，搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报

9532 点击 2025-06-17 09:46

o3-pro通关“推箱子”，人类怀旧小游戏成了大模型新Benchmark

推箱子、俄罗斯方块……这些人类的经典怀旧小游戏，也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏，而且表现还都不错，直接突破了benchmark上限

来自主题: AI技术研报

11227 点击 2025-06-16 17:26

仅凭一篇博客，他成功入职OpenAI！核心技术或用于GPT-5训练

未中顶会，没有发表arXiv，一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至，它可能被用于训练下一代超级模型GPT-5。

来自主题: AI资讯

9843 点击 2025-06-16 17:22