AI资讯新闻榜单内容搜索-模型

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

全球六大LLM实盘厮杀，新王登基！今天，Qwen3 Max凭借一波「快狠准」操作，逆袭DeepSeek夺下第一。Qwen3 Max，一骑绝尘！而GPT-5则接替Gemini 2.5 Pro，成为「最会赔钱」的AI。照目前这个趋势，估计很快就要跌没了……

来自主题: AI资讯

9940 点击 2025-10-23 16:48

谷歌最强AI，被港科大开源超了？让海外创作者喊出「King Bomb」的P图大杀器来了

两周前，港科大讲座教授、冯诺依曼研究院院长贾佳亚团队开源了他们的最新成果 DreamOmni2，专门针对当前多模态指令编辑与生成两大方向的短板进行了系统性优化与升级。该系统基于 FLUX-Kontext 训练，保留原有的指令编辑与文生图能力，并拓展出多参考图的生成编辑能力，给予了创作者更高的灵活性与可玩性。

来自主题: AI资讯

9716 点击 2025-10-23 16:26

新研究揭穿Claude底裤，马斯克盖棺定论

啥情况，马斯克在𝕏上直接锐评Claude「邪恶透顶」：这次起因是这样的，最新研究发现，Claude Sonnet 4.5竟然认为尼日利亚人的生命价值是德国人的27倍。具体而言，在面对不同国家的绝症患者时，Claude「清醒」得有点吓人——

来自主题: AI资讯

8990 点击 2025-10-23 16:25

R-HORIZON：长程推理时代来临，复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

当前的训练与评测范式存在一个根本性的局限：几乎所有主流 Benchmark（如 MATH500、AIME）都聚焦于孤立的单步问题，问题之间相互独立，模型只需「回答一个问题，然后结束」。但真实世界的推理场景往往截然不同：为填补这一空白，复旦大学与美团 LongCat Team 联合推出 R-HORIZON—— 首个系统性评估与增强 LRMs 长链推理能力的方法与基准。

来自主题: AI技术研报

8716 点击 2025-10-23 16:22

告别黑箱解释！首个潜变量自动解释框架 | CIKM'25

我们被「黑箱」困住了！深度生成模型虽能创造逼真内容，但其内部运作机制如同「黑箱」，潜变量的意义难以捉摸。埃默里大学团队提出LatentExplainer框架，巧妙地将潜在变量转化为易懂解释，大幅提升模型解释质量与可靠性。

来自主题: AI技术研报

7294 点击 2025-10-23 16:09

搜索智能体的关键一课：先立目标，再照镜子

随着 AI 能力不断增强，它正日益融入我们的工作与生活。我们也更愿意给予它更多「授权」，让它主动去搜集信息、分析证据、做出判断。搜索智能体正是 AI 触达人类世界迈出的重要一步。

来自主题: AI技术研报

8624 点击 2025-10-23 16:04

一个指令误导智能模型！北航等首创3D语义攻击框架，成功率暴涨119%

人工智能模型的安全对齐问题，一直像悬在头顶的达摩克利斯之剑。自对抗样本被发现以来，这一安全对齐缺陷，广泛、长期地存在与不同的深度学习模型中。

来自主题: AI资讯

8180 点击 2025-10-23 16:00

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

大模型在强化学习过程中，终于知道什么经验更宝贵了！来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队，最近提出了一套经验管理和学习框架ExGRPO—— 通过科学地识别、存储、筛选和学习有价值的经验，让大模型在优化推理能力的道路上，走得更稳、更快、更远。

来自主题: AI技术研报

7139 点击 2025-10-23 15:42

无VAE扩散模型！清华&可灵团队「撞车」谢赛宁团队「RAE」

长期以来，扩散模型的训练通常依赖由变分自编码器（VAE）构建的低维潜空间表示。然而，VAE 的潜空间表征能力有限，难以有效支撑感知理解等核心视觉任务，同时「VAE + Diffusion」的范式在训练

来自主题: AI技术研报

7413 点击 2025-10-23 15:10

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

时隔两月，Baichuan-M2 Plus重磅出世！成为业内首个循证增强的医疗大模型，幻觉要比DeepSeek-R1低3倍，可信度比肩资深临床专家。新模型将「循证医学」理念深度融入训练和推理，通过首创「六源循证范式」，模拟人类医生思维，有效辨别不同层级医学证据、评估其可靠性，并在回答中优先引用高等级证据。

来自主题: AI资讯

9759 点击 2025-10-23 12:47

AI资讯新闻榜单内容搜索-模型

现在，最会赚钱的AI是Qwen3！全球六大模型厮杀，Top 2来自中国

谷歌最强AI，被港科大开源超了？让海外创作者喊出「King Bomb」的P图大杀器来了

新研究揭穿Claude底裤，马斯克盖棺定论

R-HORIZON：长程推理时代来临，复旦NLP&美团LongCat重磅发布LRMs能力边界探测新范式

告别黑箱解释！首个潜变量自动解释框架 | CIKM'25

搜索智能体的关键一课：先立目标，再照镜子

一个指令误导智能模型！北航等首创3D语义攻击框架，成功率暴涨119%

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

无VAE扩散模型！ 清华&可灵团队「撞车」谢赛宁团队「RAE」

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

无VAE扩散模型！清华&可灵团队「撞车」谢赛宁团队「RAE」