AI资讯新闻榜单内容搜索-ATI

刚刚，OpenAI股改完成，非营利主体更名

刚刚，OpenAI宣布已完成资本结构重组。这就意味着，OpenAI上市的道路已经铺平，而软银前几天刚批准的225亿美元投资，也将顺利到账。具体来说，OpenAI重组后，非营利主体（即原本的OpenAI Nonprofit）改名为OpenAI Foundation，继续掌控营利实体——

来自主题: AI资讯

11531 点击 2025-10-29 09:43

刚刚，Thinking Machines Lab博客提出在策略蒸馏，Qwen被cue 38次

刚刚，不发论文、爱发博客的 Thinking Machines Lab （以下简称 TML）再次更新，发布了一篇题为《在策略蒸馏》的博客。在策略蒸馏（on-policy distillation）是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时，TML 发现在策略蒸馏可以极低的成本超越其他方法。

来自主题: AI技术研报

9006 点击 2025-10-28 10:50

仅100种子题，合成数据质量超GPT-5，阿里、上交提出Socratic-Zero框架

阿里巴巴与上海交通大学 EPIC Lab 联合提出 Socratic-Zero，一个完全无外部数据依赖的自主推理训练框架。该方法仅从 100 个种子问题出发，通过三个智能体的协同进化，自动生成高质量、难度自适应的课程，并持续提升模型推理能力。

来自主题: AI技术研报

8511 点击 2025-10-24 16:45

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。

来自主题: AI技术研报

7831 点击 2025-10-23 11:41

Z Potentials｜专访胡渊鸣，清华姚班 × MIT博士，打造500万+用户的3D AI平台Meshy，一年营收增长18x

生成式 AI 正在重写 3D 内容的生产流程：从“DCC 工具 + 外包”的线性供给，演进到“资产规模化生成 + 管线可用”的指数供给模式。过去五年，技术范式经历了从实时体积渲染，NeRF，到Score Distillation，3D扩散的快速迭代；需求侧则由游戏与影视，向3D 打印、电商样机、数字人、教育培训、以及AR/VR等长尾场景外溢。

来自主题: AI资讯

10360 点击 2025-10-21 16:30

解读IDC《中国AI翻译技术评估》报告：大模型带来“技术平权”，新的分水岭在哪？

2025 年 10 月，国际数据公司（International Data Corporation，IDC）发布了《中国 AI 翻译技术评估》报告。这份以“大模型驱动 AI 翻译能力全面换新”为主题的报告指出，大模型技术的全面渗透正在深刻重塑 AI 翻译市场。

来自主题: AI资讯

8820 点击 2025-10-21 10:45

1.58bit不输FP16！微软推出全新模型蒸馏框架，作者全是华人

1.58bit量化，内存仅需1/10，但表现不输FP16？微软最新推出的蒸馏框架BitNet Distillation（简称BitDistill），实现了几乎无性能损失的模型量化。

来自主题: AI技术研报

7235 点击 2025-10-20 14:35

AI点外卖哪家强，美团LongCat团队做了个全面评测

美团LongCat团队发布了当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench（Versatile Interactive Tasks Benchmark）。VitaBench以外卖点餐、餐厅就餐、旅游出行三大高频生活场景为典型载体，构建了一个包含66个工具的交互式评测环境，并设计了跨场景综合任务。

来自主题: AI技术研报

8448 点击 2025-10-20 10:13

多轮Agent训练遇到级联失效？熵控制强化学习来破局

在训练多轮 LLM Agent 时（如需要 30 + 步交互才能完成单个任务的场景），研究者遇到了一个严重的训练不稳定问题：标准的强化学习方法（PPO/GRPO）在稀疏奖励环境下表现出剧烈的熵值震荡，导致训练曲线几乎不收敛。

来自主题: AI技术研报

7632 点击 2025-10-19 12:06

谢赛宁新作：VAE退役，RAE当立

谢赛宁团队最新研究给出了答案——VAE的时代结束，RAE将接力前行。其中表征自编码器RAE（Representation Autoencoders）是一种用于扩散Transformer（DiT）训练的新型自动编码器，其核心设计是用预训练的表征编码器（如DINO、SigLIP、MAE 等）与训练后的轻量级解码器配对，从而替代传统扩散模型中依赖的VAE（变分自动编码器）。

来自主题: AI技术研报

8883 点击 2025-10-14 16:34