AI资讯新闻榜单内容搜索-大模型

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

针对「大模型推理速度慢，生成token高延迟」的难题，莫纳什、北航、浙大等提出R-Stitch框架，通过大小模型动态协作，衡量任务风险后灵活选择：简单任务用小模型，关键部分用大模型。实验显示推理速度提升最高4倍，同时保证高准确率。

来自主题: AI技术研报

7774 点击 2025-10-18 12:21

小米最新大模型成果！罗福莉现身了

小米的最新大模型科研成果，对外曝光了。就在最近，小米AI团队携手北京大学联合发布了一篇聚焦MoE与强化学习的论文。而其中，因为更早之前在DeepSeek R1爆火前转会小米的罗福莉，也赫然在列，还是通讯作者。

来自主题: AI技术研报

9414 点击 2025-10-17 16:44

谷歌×耶鲁联手发布抗癌神器！AI推理精准狙击「隐身」癌细胞

近日，谷歌与耶鲁大学联合发布的大模型C2S-Scale，首次提出并验证了一项全新的「抗癌假设」。这一成果表明，大模型不仅能复现已知科学规律，还具备生成可验新科学假设的能力。

来自主题: AI技术研报

7943 点击 2025-10-17 16:35

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

英伟达桌面超算，邪修玩法来了！两台DGX Spark串联一台苹果Mac Studio，就能让大模型推理速度提升至2.77倍。

来自主题: AI资讯

7776 点击 2025-10-17 16:16

神经网络与符号系统大一统！华盛顿大学教授把AI逻辑统一成了张量表示

在通往AGI的道路上，人类欠缺的是一种合适的编程语言？华盛顿大学计算机学院教授Pedro Domingos在最新的独作论文中表示，当前AI领域使用的编程语言，无一例外全都存在缺陷。同时，Domingos还提出了一种新的统一语言，将AI逻辑统一成了张量表示。

来自主题: AI技术研报

8525 点击 2025-10-17 15:43

多模态大模型首次实现像素级推理！3B参数超越72B传统模型，NeurIPS 2025收录

多模态大模型首次实现像素级推理，指代、分割、推理三大任务一网打尽！

来自主题: AI技术研报

9955 点击 2025-10-17 10:01

RL微调，关键在前10%奖励！基于评分准则，Scale AI等提出新方法

大模型强化学习总是「用力过猛」？Scale AI联合UCLA、芝加哥大学的研究团队提出了一种基于评分准则（rubric）的奖励建模新方法，从理论和实验两个维度证明：要想让大模型对齐效果好，关键在于准确区分「优秀」和「卓越」的回答。这项研究不仅揭示了奖励过度优化的根源，还提供了实用的解决方案。

来自主题: AI技术研报

8836 点击 2025-10-17 09:48

当Search Agent遇上不靠谱搜索结果，清华团队祭出自动化红队框架SafeSearch

在 AI 发展的新阶段，大模型不再局限于静态知识，而是可以通过「Search Agent」的形式实时连接互联网。搜索工具让模型突破了训练时间的限制，但它们返回的并非总是高质量的资料：一个低质量网页、一条虚假消息，甚至是暗藏诱导的提示，都可能在用户毫无察觉的情况下被模型「采纳」，进而生成带有风险的回答。

来自主题: AI技术研报

8644 点击 2025-10-17 09:33

AI玩拼图游戏暴涨视觉理解力，告别文本中心训练，无需标注的多模态大模型后训练范式

在多模态大模型的后训练浪潮中，强化学习驱动的范式已成为提升模型推理与通用能力的关键方向。

来自主题: AI技术研报

8544 点击 2025-10-17 09:26

谷歌开源全栈平台Coral NPU，能让大模型在手表上全天候运行

他们又推出了 Coral NPU，可用于构建在低功率设备上持续运行的 AI。具体来说，其可在可穿戴设备上运行小型 Transformer 模型和 LLM，并可通过 IREE 和 TFLM 编译器支持 TensorFlow、JAX 和 PyTorch。

来自主题: AI资讯

12205 点击 2025-10-17 08:38