AI资讯新闻榜单内容搜索-3

从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述

过去几年，大语言模型（LLM）的训练大多依赖于基于人类或数据偏好的强化学习（Preference-based Reinforcement Fine-tuning, PBRFT）：输入提示、输出文本、获得一个偏好分数。这一范式催生了 GPT-4、Llama-3 等成功的早期大模型，但局限也日益明显：缺乏长期规划、环境交互与持续学习能力。

来自主题: AI技术研报

7520 点击 2025-09-09 10:49

继封禁中国公司后，Anthropic 刚刚宣布：支持SB 53 法案

继封禁中国公司后，Anthropic 刚刚宣布：支持SB 53 法案。继上周封禁中国公司 API 访问后，这家 AI 公司表示，该法案为监管前沿 AI 公司构建的强大 AI 系统提供了坚实基础，通过透明度而非技术微观管理来实现监管。

来自主题: AI资讯

7663 点击 2025-09-08 21:58

一个能让 iPhone 用上 AI 的配件，1300 万人围观，但我觉得大可不必

如果把当下最让人迷惑的科技产品拉个清单，AI 硬件网红们绝对榜上有名。从 699 美元的 Humane Ai Pin 到 200 美元的 Rabbit R1，这些 AI 创业公司都在兜售同一个美丽的谎言：你需要专门的硬件才能体验真正的 AI。今天，这个名单上又多了一个新成员——AI Key。

来自主题: AI资讯

7125 点击 2025-09-08 16:33

扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍

经历了前段时间的鸡飞狗跳，扎克伯格的投资似乎终于初见成效。

来自主题: AI技术研报

6004 点击 2025-09-08 16:30

3999让机器人家务全包，抱抱脸联合创始人：开源YYDS！

3999元，不够买一台苹果手机，但能DIY个机器人（doge）。

来自主题: AI资讯

8521 点击 2025-09-08 11:58

陶哲轩都惊了！o3首战「AI奥数」碾压夺冠，开源军团仅差5分狂追OpenAI

AI界奥数杯，重启了！OpenAI o3首次杀入赛场，在算力拉满的情况下，直接以最高47分的逆天成绩炸翻全场。值得一提的是，前五模型合并得分仅与o3差5分，开源与闭源差距再次缩小。

来自主题: AI资讯

6870 点击 2025-09-08 10:48

空间智能新高度：港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer

香港科技大学谭平教授团队与地平线（Horizon Robotics）团队最新发布了一项 3D 场景表征与大规模重建新方法 SAIL-Recon，通过锚点图建立构建场景全局隐式表征，突破现有 VGGT 基础模型对于大规模视觉定位与 3D 重建的处理能力瓶颈，实现万帧级的场景表征抽取与定位重建，将空间智能「3D 表征与建模」前沿推向一个新的高度。

来自主题: AI技术研报

6523 点击 2025-09-08 10:19