AI资讯新闻榜单内容搜索-大模型

Agent 的下半场，是账单｜对话 OpenClacky 李亚飞

让 AI 来管理代码的话，每次读 500 行反而比读 1000 行更费 Token，而且人工编排流程真不如让大模型自己定，「很多的事儿，还是很反直觉的」

来自主题: AI资讯

9262 点击 2026-05-21 10:14

520，遇见国产「新模王」Qwen3.7-Max！

仅仅一个月后，阿里又带着最强旗舰模型杀回来了！今天上午，在 2026 阿里云峰会上，阿里全新一代千问旗舰模型 Qwen3.7-Max 登场了！在 Arena 公布的最新一期全球大模型盲测总榜中，Qwen3.7-Max 总成绩位列国产模型第一：傲视一众国产大模型

来自主题: AI资讯

10096 点击 2026-05-20 16:26

高潮从第几秒开始？GaMMA 让多模态大模型真正「听懂」音乐时间线

大模型的能力边界正在不断拓展，从文字到视觉，再到音频，全模态理解已渐成现实。然而，当你问一个多模态大模型「这首歌的高潮从第几秒开始？」或者「第 30 秒之后乐器编配发生了什么变化？」，得到的往往是一个模糊甚至错误的回答。

来自主题: AI技术研报

6737 点击 2026-05-20 09:51

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。

来自主题: AI技术研报

7504 点击 2026-05-19 15:32

伯克利神作背刺OpenAI：持续学习才是真神！

伯克利等发布FST框架：通过快慢分层解决大模型持续学习死局。

来自主题: AI技术研报

8357 点击 2026-05-19 15:31

让大模型学会「自己教自己」！京东&中科院信工所连发三篇论文定义Self-Taught RLVR

最近，京东和中科院信工所展开了Self-Taught RLVR的系列研究，并连发三篇后训练新作。

来自主题: AI技术研报

7162 点击 2026-05-19 14:59

股价暴涨2300%！靠AI猛吸金的妖股，反手骂大模型都是“泔水”

今年以来，Palantir股价已累计下跌近20%。

来自主题: AI资讯

9045 点击 2026-05-19 10:03

ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考

近年来，Chain-of-Thought（CoT）推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报

7051 点击 2026-05-19 10:01

9.9元起！三大运营商杀入Token生意，以后用AI就像交话费？

最近几天，中国电信、中国移动、中国联通接连推出Token套餐及相关AI服务，面向个人、家庭、开发者、中小微企业等用户销售大模型调用量。这是三大运营商首次正式入局Token生意，而此前相关业务由大模型厂商、互联网大厂和云服务商主导。

来自主题: AI资讯

9003 点击 2026-05-18 21:38

ICML 2026 | 华为GTS提出AI训练数据新方法，Amazon/Google作者团队「光速跟进」：难度自适应训练正在成为新范式

在大模型后训练中，数据不再只是 “越多越好”，而是要像人类学习一样，动态选择最合适难度的样本。华为提出的 EDCO 方法，将样本难度估计与动态课程编排引入领域大模型微调；数月后，由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO，并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报

5729 点击 2026-05-18 15:29