AI资讯新闻榜单内容搜索-大语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大语言模型
类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

类比的长河,为何流到大模型就被截流?

当我们遇到新问题时,往往会通过类比过去的经验来寻找解决方案,大语言模型能否如同人类一样类比?在对大模型的众多批判中,人们常说大模型只是记住了训练数据集中的模式,并没有进行真正的推理。

来自主题: AI技术研报
9603 点击    2025-04-03 10:50
动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

动态场景,开放文本查询!清华哈佛联合建模4D语言场 | CVPR 2025

4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态变化网络实现语义特征的平滑建模,显著提升了动态语义场的建模能力。

来自主题: AI技术研报
4111 点击    2025-04-02 15:05
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭

在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。

来自主题: AI技术研报
8137 点击    2025-04-02 14:58
OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯
8736 点击    2025-04-01 09:15
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型(LRM,Large Reasoning Model)带来了新的 post-training scaling law,强化学习(RL,Reinforcement Learning)成为了大语言模型能力提升的新引擎。然而,针对大语言模型的大规模强化学习训练门槛一直很高:

来自主题: AI技术研报
9725 点击    2025-03-31 15:07
被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

被LangChain折磨够了吗?试下100行代码打造的LLM有向图框架PocketFlow | 独家最新

你是否曾对着一个繁复的AI框架,无奈地想:"真有必要搞得这么复杂吗?"在与臃肿框架斗争一年后,Zachary Huang博士决定大刀阔斧地革新,剔除所有花里胡哨的部分。于是Pocket Flow诞生了——一个仅有100行代码的超轻量级大语言模型框架!

来自主题: AI技术研报
9106 点击    2025-03-31 09:48
GDC上的中国游戏AI智能体们

GDC上的中国游戏AI智能体们

GDC上的中国游戏AI智能体们

关于AI智能体,GDC上腾讯游戏魔方工作室分享了《F.A.C.U.L:首个懂人类语言的 FPS AI 队友》的演讲(这个技术去年就有曝光),项目融合语音输入、大语言模型、实时文本转语音等生成式AI技术,让玩家能与AI队友沉浸式协同作战。

来自主题: AI资讯
7225 点击    2025-03-30 11:28
为什么大模型在 OCR 任务上表现不佳?

为什么大模型在 OCR 任务上表现不佳?

为什么大模型在 OCR 任务上表现不佳?

你是否曾经用最先进的大语言模型处理企业文档,却发现它把财务报表中的“$1,234.56”读成了“123456”?或者在处理医疗记录时,将“0.5mg”误读为“5mg”?对于依赖数据准确性的运营和采购团队来说,这些问题不仅影响工作效率,更可能导致财务损失、法律风险甚至造成医疗事故。

来自主题: AI技术研报
6279 点击    2025-03-28 10:25
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 DeepSeek-R1 类推理型人工智能金融大模型:Fin-R1,以仅 7B 的轻量化参数规模展现出卓越性能,全面超越参评的同规模模型并以 75 的平均得

来自主题: AI技术研报
7233 点击    2025-03-27 09:41
得到多位院士高度肯定!海洋大语言模型“瀚海智语”发布!海洋领域首个业务化垂域大模型,海洋专业测试成绩排名第一

得到多位院士高度肯定!海洋大语言模型“瀚海智语”发布!海洋领域首个业务化垂域大模型,海洋专业测试成绩排名第一

得到多位院士高度肯定!海洋大语言模型“瀚海智语”发布!海洋领域首个业务化垂域大模型,海洋专业测试成绩排名第一

3月24日,从自然资源部获悉,国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司,以360智脑13B和Deepseek-R1-70B大模型为基座成功开发了海洋垂直领域大语言模型——“瀚海智语”(英文名称OceanDS)。

来自主题: AI资讯
8804 点击    2025-03-24 15:19