AI资讯新闻榜单内容搜索-大模

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报

8319 点击 2025-07-27 12:43

在WAIC现场，全球首个拥有「原生记忆力」的大模型亮相，但不是Transformer

国内 AI 创企 RockAI 提出的非 Transformer 架构 Yan 2.0 Preview。这个架构极大地降低了模型推理时的计算复杂度，因此可以在算力非常有限的设备上离线运行，比如树莓派。

来自主题: AI资讯

9946 点击 2025-07-26 19:51

Step-3 发布：包括发布会上没说的，都在这了

今天下午，阶跃星辰在 WAIC 2025 开幕前夕发布新一代基础大模型 Step 3，并宣布将在 7 月 31 日面向全球企业和开发者开源。MoE 架构，321B 总参，38B 激活

来自主题: AI资讯

11171 点击 2025-07-25 23:25

WAIC抢先爆料：金融“黑马”大模型超DeepSeek刷新SOTA，论文已上线

又到了一年一度“中国AI春晚”WAIC，各家大厂动作频发的时候。今年会有哪些看点？你别说，我们还真在扒论文的过程中，发现了一些热乎线索。比如蚂蚁数科的金融推理大模型，发布会还没开，技术论文已悄咪咪上线。金融领域的推理大模型，你可以理解为金融领域的DeepSeek，带着SOTA的刷榜成绩来了。

来自主题: AI资讯

8697 点击 2025-07-25 17:40

AI教父Hinton首次现身中国，合照全网刷屏！预警AI觉醒临界点已至

等了50年，AI教父Hinton终于「真人现身」中国了！这位图灵奖+诺奖教父级大神，不仅亲自踏上魔都土地，还与市委书记同框合影，瞬间刷屏全网！最近他再次预言，AI已进入觉醒倒计时。现在全网都在翘首以待，准备迎接明天他的高能演讲。

来自主题: AI资讯

8059 点击 2025-07-25 17:18

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

如何理解大模型推理能力？现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。就是那位和清华姚班马腾宇等人证明了只要思维链足够长，Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法，在斯坦福大学CS25上讲了一堂“LLM推理”课。

来自主题: AI资讯

8579 点击 2025-07-25 16:57