AI资讯新闻榜单内容搜索-数据

打破代码大模型训练瓶颈：微软&剑桥&普林推出MicroCoder，算法、数据、框架、训练经验全面升级

新一代代码模型的训练动态已与旧模型截然不同，主流强化学习方法和数据集在其上几乎“失效”。

来自主题: AI技术研报

10485 点击 2026-03-30 09:29

独家 | 3个月融3轮，2026“物理AI”黑马诞生

就在行业仍为数据瓶颈焦虑时，一家名为深度机智（DeepCybo）的公司悄然浮出水面。投中网独家获悉，作为北京中关村学院与中关村人工智能研究院孵化的首家具身智能企业，它凭借独特的“人类第一视角”技术路线，在短短3周内吸引了超60家投资机构密集对接。

来自主题: AI资讯

9408 点击 2026-03-29 11:05

Claude Code auto mode 解析：如何用 AI 分类器替代人工审批

用 Claude Code 写代码的人都熟悉一个场景：Claude 每执行一个命令、每改一个文件，都要你点一次“同意”。Anthropic 的数据显示，用户 93% 的操作都会批准。也就是说，这个“安全审批”环节，绝大多数时候只是一个条件反射。

来自主题: AI技术研报

9626 点击 2026-03-26 16:52

刷榜多元时序预测，性能波动0%！打破CI/CD二元对立 | ICLR'26

ICLR'26新研究CPiRi打破时序预测僵局：用冻结底座提取时序特征，轻量模块专注学习通道间真实关系，不靠位置编码「背答案」。测试中通道乱序性能零波动，仅用25%数据即可泛化至全网络，真正实现鲁棒与精准双赢。

来自主题: AI技术研报

7628 点击 2026-03-26 10:50

「百万级」视频推理数据集！30+顶尖高校联合发布

AI视频生成已能「画得像」，但不会「想得对」。VBVR推出百万级视频推理数据集，首次系统评测模型对空间、物理、逻辑和抽象的推理能力，发现顶尖模型通过率仅68%，暴露其缺乏真实认知，推动视频AI从「视觉模仿」迈向「智能推理」。

来自主题: AI技术研报

6799 点击 2026-03-26 10:49

用SFT打出RL的效果？微软联合提出高效后训练算法

在大模型后训练阶段，监督微调（SFT）和强化学习（RL）是两根不可或缺的支柱。SFT 利用高质量的离线（Off-policy）数据快速注入知识，但受限于静态数据分布，泛化能力往往容易触及天花板并带来灾难性遗忘；RL 则允许模型在探索中不断自我迭代，产生与当前策略同分布（On-policy）的数据，上限极高，但往往伴随着训练极度不稳定、计算资源消耗巨大的痛点。

来自主题: AI技术研报

5999 点击 2026-03-26 10:47