AI资讯新闻榜单内容搜索-模型

LLM终于学会推公式了！博世x清华推出FunctionEvolve：LLM-SRBench提升3.6倍，AI-Feynman满分

来自博世中央研究院与清华大学的研究人员提出 FunctionEvolve 框架，在两大基准测试上大幅刷新了这项任务的结果。在 LLM-SRBench 的 129 个合成科学方程任务上，FunctionEvolve 最终给出的公式在 55.8% 的任务上与真实公式等价（SA@1 = 72/129），是此前最好结果的 3.6 倍；

来自主题: AI技术研报

7538 点击 2026-06-20 10:24

碰撞暴降45.5%、200km 0接管！港大团队：自动驾驶真正的突破不在预训练，在后训练

香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队，发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving给出了系统回答。

来自主题: AI技术研报

8093 点击 2026-06-20 10:24

ICML 2026｜Agent通讯的「运营商」哪家强？UIUC团队发布ProtocolBench

多智能体系统正在从学界走向业界。在 Coding、Research 等真实场景里，越来越多系统不再只依赖单个 agent，而是由多个 Agent 分工协作：有人负责规划，有人负责检索，有人调用工具，

来自主题: AI技术研报

8264 点击 2026-06-20 10:21

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒的时代结束了

本研究由快手科技语言大模型团队完成，核心作者吕民轩、梅铁桦、杜坦隆等。快手科技与中国科学院大学联合提出 GoLongRL，一套完全开源的长上下文强化学习后训练方案，包含 23K 样本 RLVR 数据集

来自主题: AI技术研报

7600 点击 2026-06-20 10:21

刚刚，诺贝尔奖得主成Anthropic新员工！

诺贝尔奖得主，入职Anthropic了！今天，AlphaFold核心领导者John Jumper官宣：离开工作近9年的Google DeepMind，加入Anthropic。用一个AI模型改写了整个结构生物学的诺奖得主，转身走了。

来自主题: AI资讯

9358 点击 2026-06-20 08:14

GLM-5.2全球免费6小时，马斯克点赞，HuggingFace掏钱

昨夜，全球最大的 AI 开源社区 Hugging Face 官宣了一项前所未有的决定：自掏腰包为智谱 AI 最新开源的旗舰模型 GLM-5.2 提供长达 6 小时的全球免费算力支持。这是 Hugging Face 第一次真金白银为国产模型开这种 “专属 VIP 通道”，海外网友纷纷直呼这波 “倒贴” 好！

来自主题: AI资讯

8947 点击 2026-06-19 16:48