AI资讯新闻榜单内容搜索-模型训练

苹果新研究：不微调、不重训，如何让AI提问效率暴增6.5倍？

在这场以大型语言模型（LLM）为核心的 AI 浪潮中，苹果似乎一直保持着低调，很少出现在技术报道的前沿。尽管如此，时不时地，该公司也能拿出一些非常亮眼的研究成果，比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。

来自主题: AI技术研报

9217 点击 2025-09-03 13:04

告别无效计算！新TTS框架拯救19%被埋没答案，推理准确率飙升

大语言模型通过 CoT 已具备强大的数学推理能力，而 Beam Search、DVTS 等测试时扩展（Test-Time Scaling, TTS）方法可通过分配额外计算资源进一步提升准确性。然而，现有方法存在两大关键缺陷：路径同质化（推理路径趋同）和中间结果利用不足（大量高质量推理分支被丢弃）。

来自主题: AI技术研报

9363 点击 2025-09-03 12:03

你的RAG系统有个数学BUG，DeepMind首次证明嵌入向量检索召回能力有限

最近，工业界“RAG已死”甚嚣尘上。过去几年，AI领域的主旋律是“规模定律”（Scaling Law），即更大的模型、更多的数据会带来更好的性能。即便偶然有瑕疵，也认为只是工程上的不足，并非数学上的不可能。

来自主题: AI技术研报

10082 点击 2025-09-03 11:54

第一性原理视角下的MoE推理的经济学分析

随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家（MoE）模型的相继发布，它们已成为智能前沿领域大语言模型（LLM）的领先架构。由于其庞大的规模（1万亿参数及以上）和稀疏计算模式（每个token仅激活部分参数而非整个模型），MoE式LLM对推理工作负载提出了重大挑战，显著改变了底层的推理经济学。

来自主题: AI技术研报

8618 点击 2025-09-03 11:22

IROS 2025 | 机器人衣物折叠新范式，NUS邵林团队用MetaFold解耦轨迹与动作

机器人对可形变物体的操作（Deformable Object Manipulation, DOM），是衡量通用机器人智能水平的关键指标之一。与刚体操作不同，衣物、绳索、食物等物体的形态不固定，其状态空间维度极高，且物理交互过程呈现出复杂的非线性动力学特性，为感知、规划和控制带来了巨大挑战。

来自主题: AI技术研报

7619 点击 2025-09-03 11:07

图像编辑太慢太粗糙？全新开源自回归模型实现精准秒级修改 | 智象未来

AI图像编辑技术发展迅猛，扩散模型凭借强大的生成能力，成为行业主流。但这类模型在实际应用中始终面临两大难题：一是“牵一发而动全身”，即便只想修改一个细节，系统也可能影响到整个画面；二是生成速度缓慢，难以满足实时交互的需求。

来自主题: AI技术研报

7631 点击 2025-09-03 10:56

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。

来自主题: AI技术研报

8701 点击 2025-09-03 10:47

无惧AI失业潮的「铁饭碗」，微软揭秘了！能干到退休

22-25岁初入职场的年轻人，就业率同比已经下降了13%，AI带来的就业冲击愈发严峻。一些老板们也开始冻结招聘，将AI能力不足的求职者直接拒之门外。AI造就的新形势迫使我们认真思考，哪些岗位是很难被AI取代的呢？

来自主题: AI资讯

10397 点击 2025-09-03 10:29

DeepSeek、GPT-5都在尝试的快慢思考切换，有了更智能版本，还是多模态

当前，业界顶尖的大模型正竞相挑战“过度思考”的难题，即无论问题简单与否，它们都采用 “always-on thinking” 的详细推理模式。无论是像 DeepSeek-V3.1 这种依赖混合推理架构提供需用户“手动”介入的快慢思考切换，还是如 GPT-5 那样通过依赖庞大而高成本的“专家路由”机制提供的自适应思考切换。

来自主题: AI技术研报

7572 点击 2025-09-02 12:27

Nano Banana为什么能秒杀GPT-4o成为新晋AI图像王者？创始人下场解答

GPT-4o发布才过去半年，Nano Banana这种「下一代」的生图模型就出来了。这难道是AI界的摩尔定律？不敢想再过半年后，会是什么样的「魔鬼级」生图模型来屠Nano Banana

来自主题: AI资讯

9201 点击 2025-09-02 12:10