AI资讯新闻榜单内容搜索-模型

吴恩达、Karpathy 天使轮，微软、SpaceX抢购，Inception到底什么来头？

扩散模型杀进了文本生成的地盘，而巨头们为了抢它，已经打起来了。

来自主题: AI资讯

7921 点击 2026-05-18 17:54

「世界模型」究竟是什么？一文看懂其前世今生与百亿赌局

世界模型（World Model），想必你已经在很多场合听过这个术语了。它有时出现在视频生成领域，有时又出现在具身智能领域；它们的含义还有所差别，甚至看起来像是完全不同的概念。

来自主题: AI技术研报

6834 点击 2026-05-18 16:48

CVPR 2026 Oral | 清华+阿里发布ViT³：解锁「视觉TTT」新架构，突破Transformer复杂度瓶颈

序列建模是大语言模型、计算机视觉等领域的基础共性问题。当前通用的 Transformer 模型计算复杂度随序列长度平方增长，在长序列任务中面临显著的计算挑战。因此，研究者们一直在探索具有线性计算复杂度的高效序列建模方法。

来自主题: AI技术研报

6013 点击 2026-05-18 15:30

LLM助力突破尘封60年数学猜想！北大王立威团队大幅刷新斯坦纳比下界

近期，LLM 已经在 IMO 上取得了很好的成绩，在一些研究级数学上（如短程证明、组合构造）也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想，结果会是如何？

来自主题: AI技术研报

5778 点击 2026-05-18 15:29

信通院&清华提出FedRE：用「纠缠」搞定联邦学习三难困境 | CVPR 26

在联邦学习中，如何同时兼顾模型性能、数据隐私和通信开销，是一个亟需解决的挑战。

来自主题: AI技术研报

10232 点击 2026-05-18 15:29

ICML 2026 | 华为GTS提出AI训练数据新方法，Amazon/Google作者团队「光速跟进」：难度自适应训练正在成为新范式

在大模型后训练中，数据不再只是 “越多越好”，而是要像人类学习一样，动态选择最合适难度的样本。华为提出的 EDCO 方法，将样本难度估计与动态课程编排引入领域大模型微调；数月后，由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO，并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报

5753 点击 2026-05-18 15:29

DAG革新时间序列预测，代码、数据、排行榜全开源 | ICML'26

DAG框架利用时间与通道双重相关网络，有效整合历史与未来外生变量信息，提升时间序列预测准确性。通过发现并注入相关关系，充分利用未来协变量，显著优于现有方法。

来自主题: AI技术研报

7431 点击 2026-05-18 15:28

ICML 2026 ｜让大模型边想边说：这篇文章把「何时开口」变成可学习策略

用过推理型大模型的人，大概率都熟悉这种体验：模型似乎在认真思考，但屏幕上长时间没有真正有用的内容；如果让它一开始就输出，又很容易出现仓促判断，后面的推理还要被早期错误牵着走。

来自主题: AI技术研报

10020 点击 2026-05-18 15:27

Claude杀入华尔街，10个智能体接入Office全家桶，爆改分析师桌面

Anthropic一口气甩出10个金融智能体模板，穆迪6亿家公司数据通过MCP打通，Office全家桶全线就位：这不是模型升级，是一次工作流入口的抢占。

来自主题: AI资讯

6657 点击 2026-05-18 11:34

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了｜香港中文大学最新

早在2024年，人们还倾向于给Agent提供海量的工具（例如通过MCP协议连接的API、搜索引擎、代码解释器等）。但是，“拥有工具”并不等于“知道如何使用工具”。当任务变得复杂且长周期时，要求Agent每次都从头开始推理“该用哪个工具、何时用、怎么组合、出错怎么办”，会导致系统极度脆弱、延迟极高且不可靠。

来自主题: AI技术研报

6970 点击 2026-05-18 09:55