AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

相信我们的读者都对 AI 顶会有非常大的关注和热情,有的读者最近可能刚从 NeurIPS rebuttal 脱身,又开始为下一篇做准备了。 作为推动技术革新与思想碰撞的核心引擎,顶级学术会议不仅是整个学界的生命线,更是我们洞察未来的前沿阵地。

来自主题: AI技术研报
5143 点击    2025-08-13 16:41
研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

强化学习(RL)是锻造当今顶尖大模型(如 OpenAI o 系列、DeepSeek-R1、Gemini 2.5、Grok 4、GPT-5)推理能力与对齐的核心 “武器”,但它也像一把双刃剑,常常导致模型行为脆弱、风格突变,甚至出现 “欺骗性对齐”、“失控” 等危险倾向。

来自主题: AI技术研报
6435 点击    2025-08-13 16:29
大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

首次实现“训练-推理不对称”,字节团队提出全新的语言模型训练方法:Post-Completion Learning (PCL)。 在训练时让模型对自己的输出结果进行反思和评估,推理时却仅输出答案,将反思能力完全内化。

来自主题: AI资讯
5739 点击    2025-08-13 16:10
刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开

刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开

刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开

时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定「多模态通用智能」——这是商汤以深厚研究积累和实践反复验证的可行路径。今天,商汤科技联合创始人、执行董事、首席科学家林达华特别撰写的万字深度长文正式发布。文章剖析了商汤为何将「多模态通用智能」视为技术战略的核心引擎,也探索性阐释了在组织及战略层面的诸多思考。通往AGI的拼图中,多模态是缺一不可的基石。

来自主题: AI资讯
6550 点击    2025-08-13 13:26
深度|当AI创业进入深水区,谁在为AI新势力提供“确定性”?

深度|当AI创业进入深水区,谁在为AI新势力提供“确定性”?

深度|当AI创业进入深水区,谁在为AI新势力提供“确定性”?

2024年,AI创业的叙事正在发生根本性转变。如果说2023年是“百模大战”的技术奇观与资本狂欢,那么今年,当市场的喧嚣逐渐沉淀,聚光灯则明确地打向了产业落地的主战场。一批真正意义上的“AI原生”新势力正在快速崛起,它们不再是传统业务的AI改良派,而是将大模型作为数字世界的地基,直接构建商业大厦的“原住民”。

来自主题: AI资讯
6857 点击    2025-08-13 11:38
AI应用如何落地政企?首先不要卷通用大模型

AI应用如何落地政企?首先不要卷通用大模型

AI应用如何落地政企?首先不要卷通用大模型

智能体元年,处处都是智能体。甚至刚落幕的ISC.AI 2025第十三届互联网安全大会,主题直接就是“ALL IN AGENT”。

来自主题: AI资讯
5862 点击    2025-08-13 11:05
商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁

商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁

商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁

具身智能「大脑」,更准确地,以「世界模型」为内核的具身智能「大脑」会成为 AI 下一阶段竞争焦点吗? 上世纪九十年代,「世界模型」思想雏形初现,之后几十年被不断强化、延伸,直到 ChatGPT 引爆 AI 新浪潮、Sora 问世、大模型落地成主流、具身智能迎来新纪元……「世界模型」或是通往「类人智能」的解法被视为新的业界共识。

来自主题: AI资讯
5322 点击    2025-08-13 11:00
LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考

LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考

LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考

随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。

来自主题: AI资讯
5601 点击    2025-08-12 15:58
刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

一觉醒来,OpenAI 的大模型又完成了一项壮举!在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一!

来自主题: AI资讯
7711 点击    2025-08-12 13:07
GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI

GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI

GPT-5数字母依然翻车!马库斯:泛化问题仍未解决,Scaling无法实现AGI

大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。

来自主题: AI资讯
6581 点击    2025-08-12 12:37