AI资讯新闻榜单内容搜索-幻觉

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 幻觉
LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

幻觉,作为AI圈家喻户晓的概念,这个词您可能已经听得耳朵起茧了。我们都知道它存在,也普遍接受了它似乎无法根除,是一个“老大难”问题。但正因如此,一个更危险的问题随之而来:当我们对幻觉的存在习以为常时,我们是否也开始对它背后的系统性风险变得麻木?我们是真的从第一性原理上理解了它,还是仅仅在用一个又一个的补丁(比如RAG)来被动地应对它?

来自主题: AI资讯
6082 点击    2025-08-15 11:03
GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss太离谱:无提示自行想象编程问题,还重复求解5000次

GPT-oss放飞自我了?!居然出现了明显的幻觉行为。 在没有提示词的情况下,消耗超过30000个token凭空想出一个问题,还反复求解了5000多次?!

来自主题: AI资讯
5242 点击    2025-08-12 11:52
首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理

研究人员首次系统综述了大型语言模型(LLM)在法律领域的应用,提出创新的双重视角分类法,融合法律推理框架(经典的法律论证型式框架)与职业本体(律师/法官/当事人角色),统一梳理技术突破与伦理治理挑战。论文涵盖LLM在法律文本处理、知识整合、推理形式化方面的进展,并指出幻觉、可解释性缺失、跨法域适应等核心问题,为下一代法律人工智能奠定理论基础与实践路线图。

来自主题: AI资讯
5791 点击    2025-08-01 11:51
游戏+AI的最终核心是好玩|MonoX

游戏+AI的最终核心是好玩|MonoX

游戏+AI的最终核心是好玩|MonoX

当前AI应用层,无数创业者都曾尝试或正走在AI+游戏的这条赛道上。AI正不断拓展游戏的边界,从赋予游戏角色(NPC)智慧,到自动化生成海量内容。然而,这条赛道并非坦途,性能、幻觉问题、玩家接受度等一系列难关等待从业者去克服。

来自主题: AI资讯
6040 点击    2025-07-28 10:59
Contextual AI:从幻觉到可信,钻研RAG架构解决企业级AI应用落地最大痛点

Contextual AI:从幻觉到可信,钻研RAG架构解决企业级AI应用落地最大痛点

Contextual AI:从幻觉到可信,钻研RAG架构解决企业级AI应用落地最大痛点

RAG(检索增强生成)作为解决大模型"幻觉"和知识时效性问题的关键技术,已成为企业AI应用的主流架构。Contextual AI由RAG技术的创始研究者组建,致力于开发能应对复杂知识密集型任务的专业智能体。

来自主题: AI资讯
7546 点击    2025-07-17 16:09
面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

面对无解问题大模型竟会崩溃?港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能,引起广泛的热度。然而在面对一些无法回答或本身无解的问题时,这些模型竟试图去虚构不存在的信息去推理解答,生成了大量的事实错误、无意义思考过程和虚构答案,也被称为模型「幻觉」 问题,如下图(a)所示,造成严重资源浪费且会误导用户,严重损害了模型的可靠性(Reliability)。

来自主题: AI技术研报
6771 点击    2025-07-17 11:24
中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

中国首个海洋领域开源大模型OceanGPT(沧渊)发布!海洋精准感知技术全国重点实验室(浙江大学)牵头研发

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发,具备基础的海洋专业知识问答,以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制,相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯
5590 点击    2025-06-29 17:03
Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类

Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类

Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类

Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏,甚至在其中的一个时间段,Claude 竟然确信自己是一个真实存在的人类,并幻觉了一些并未发生过的事件。

来自主题: AI资讯
6162 点击    2025-06-28 18:04