AI资讯新闻榜单内容搜索-幻觉

210亿美元的幻觉？奥特曼投了一家核能初创

在AI热潮里，故事比技术更值钱。一家名为Oklo的核能初创公司，靠着一个概念，市值飙到210亿美元；另一边，一个从SpaceX离职的工程师，让AI自己画电路板，几分钟搞定工程师三天的工作。一个靠叙事吸引资金，一个用技术推动生产。AI热潮下，这两家公司代表着同一时代的两种姿态——造梦，和造物。

来自主题: AI资讯

10493 点击 2025-11-20 16:23

9.9元用AI“复活”亲人：是技术的安慰，还是情感的幻觉？

“我活到 108 岁，试茶 80 多年了。” 2025 年 10 月，已故八年的“茶界泰斗”张天福再次“开口”，为福建张天福品牌管理有限公司代言。张天福之子张德友称此举已获合法授权，而遗孀张晓红则痛

来自主题: AI资讯

9016 点击 2025-11-15 14:46

曝OpenAI布道黑幕！MIT华人记者：他用全人类未来，赌一个AGI神话

当硅谷把「AGI造福全人类」包装成信仰时，真实世界却在付出代价。Karen Hao在《Empire of AI》犀利指出，这场竞赛甚至被渲染成「中美对抗」——只要跑赢中国，就能守护自由。但事实是，美国与中国差距并未拉大，唯一真正收割的，是硅谷自己。我们是否还要为这场幻觉买单？

来自主题: AI资讯

10795 点击 2025-11-11 15:29

改掉幻觉=杀死AI？Science曝光大模型「先天死穴」

《Science》的一篇新文章指出，大模型存在一个先天难解的软肋：幻觉难以根除。AI厂商让大模型在不确定性情况下说「我不知道」，虽然有助于减少模型幻觉，但可能因此影响用户留存与活跃度，动摇商业根本。

来自主题: AI技术研报

9613 点击 2025-11-09 15:35

看似万能的 AI，其实比你想的更脆弱和邪恶

十月，《纽约时报》发表了题为《The A.I. Prompt That Could End the World》（《那个可能终结世界的 AI 提示词》）的文章。作者 Stephen Witt 采访了多位业内人士：有 AI 先驱，图灵奖获奖者 Yoshua Bengio；以越狱测试著称的 Leonard Tang；以及专门研究模型欺骗的 Marius Hobbhahn。

来自主题: AI技术研报

9982 点击 2025-10-27 15:58

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

时隔两月，Baichuan-M2 Plus重磅出世！成为业内首个循证增强的医疗大模型，幻觉要比DeepSeek-R1低3倍，可信度比肩资深临床专家。新模型将「循证医学」理念深度融入训练和推理，通过首创「六源循证范式」，模拟人类医生思维，有效辨别不同层级医学证据、评估其可靠性，并在回答中优先引用高等级证据。

来自主题: AI资讯

9417 点击 2025-10-23 12:47

基础模型已颠覆科研，进入第五范式！港科大综述113篇论文 | NeurIPS'25

基础模型（FM）是一种在海量数据上训练的人工智能系统，具备强大的通用性和跨模态能力。港科大最新发表的论文显示：FM可能引领科学进入第五范式，但大模型的偏见、幻觉等问题仍需正视。

来自主题: AI技术研报

8035 点击 2025-10-16 15:01

剑桥揭开大模型翻车黑箱！别再怪它不懂推理，是行动出错了

为什么大模型，在执行长时任务时容易翻车？这让一些专家，开始质疑大模型的推理能力，认为它们是否只是提供了「思考的幻觉」。近日，剑桥大学等机构的一项研究证明：问题不是出现在推理上，而是出在大模型的执行能力上。

来自主题: AI技术研报

8452 点击 2025-10-14 11:10

苹果再发论文：精准定位LLM幻觉，GPT-5、o3都办不到

论文提出的方法名为 RL4HS，它使用了片段级奖励（span-level rewards）和类别感知的 GRPO（Class-Aware Group Relative Policy Optimization），从而避免模型偷懒、只输出无错误预测。

来自主题: AI资讯

9859 点击 2025-10-07 22:11

华人主导谷歌SLED，论文登顶会！一键让模型学会自救

大模型最让人头疼的毛病，就是一本正经地「瞎编」。过去，只能靠检索补丁或额外训练来修。可在NeurIPS 2024 上，谷歌抛出的新方法SLED却告诉我们：模型其实知道，只是最后一步忘了。如果把每一层的「声音」都纳入考量，它就能从幻觉中被拉回到事实。

来自主题: AI技术研报

7898 点击 2025-10-03 15:43