AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密

大模型幻觉,究竟是怎么来的?谷歌、苹果等机构研究人员发现,大模型知道的远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。

来自主题: AI技术研报
5269 点击    2024-11-10 14:11
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

该文章的第一作者陈麒光,目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。 该研究主要提出了推理边界框架(Reasoning Boundary Framework, RBF),首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报
4805 点击    2024-11-10 13:50
请收下,一次就能学会的AI提问技巧

请收下,一次就能学会的AI提问技巧

请收下,一次就能学会的AI提问技巧

打开AI大模型助手,问个问题,全是正确的废话,又臭又长。让它写个文案,都是套话,根本用不了。这还算好的。有时候,它答着答着就会胡言乱语,让你哭笑不得。

来自主题: AI资讯
5850 点击    2024-11-09 16:10
清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

清华厦大等提出“无限长上下文”技术,100万大海捞针全绿,Llama\Qwen\MiniCPM都能上分

大模型的记忆限制被打破了,变相实现“无限长”上下文。最新成果,来自清华、厦大等联合提出的LLMxMapReduce长本文分帧处理技术。

来自主题: AI技术研报
5329 点击    2024-11-09 15:38
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

OpenAI o1风格的推理大模型,有行业垂直版了。HK-O1aw,是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队(PKU-Alignment Team)推出的全球首个慢思考范式法律推理大模型。

来自主题: AI资讯
4445 点击    2024-11-09 15:34
详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

近期,智驾行业出现了一个融合了视觉、语言和动作的多模态大模型范式——VLA(Vision-Language-Action Model,即视觉-语言-动作模型),拥有更高的场景推理能力与泛化能力。不少智驾人士都将VLA视为当下“端到端”方案的2.0版本。

来自主题: AI资讯
4724 点击    2024-11-09 09:50
数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

数十亿美元!传亚马逊又要投资Anthropic,但有一个条件

智东西11月8日消息,据外媒The Information报道,亚马逊正讨论向美国AI大模型独角兽Anthropic进行第二笔数十亿美元的投资。

来自主题: AI资讯
3962 点击    2024-11-09 09:48
AI大模型落地,为什么是央国企先行?

AI大模型落地,为什么是央国企先行?

AI大模型落地,为什么是央国企先行?

继金融后,央国企成了AI大模型先锋官

来自主题: AI资讯
4269 点击    2024-11-08 20:09
评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

评估大模型不看输出看「内在」,上交大新测试指标入选NeurIPS 2024

能够深入大模型内部的新评测指标来了! 上交大MIFA实验室提出了全新的大模型评估指标Diff-eRank。 不同于传统评测方法,Diff-eRank不研究模型输出,而是选择了分析其背后的隐藏表征。

来自主题: AI技术研报
4359 点击    2024-11-08 19:43