AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
清华姚班校友等揭Transformer致命缺陷,OpenAI科学家紧急回应:学术界节奏太慢

清华姚班校友等揭Transformer致命缺陷,OpenAI科学家紧急回应:学术界节奏太慢

清华姚班校友等揭Transformer致命缺陷,OpenAI科学家紧急回应:学术界节奏太慢

一篇报道,在AI圈掀起轩然大波。文中引用了近2年前的论文直击大模型死穴——Transformer触及天花板,却引来OpenAI研究科学家的紧急回应。谁能想到,一篇于2023年发表的LLM论文,竟然在一年半之后又「火」了。

来自主题: AI技术研报
6473 点击    2025-02-11 14:16
“AI照骗”如今的信任危机,靠打水印真能解决吗

“AI照骗”如今的信任危机,靠打水印真能解决吗

“AI照骗”如今的信任危机,靠打水印真能解决吗

众所周知,由各类大模型驱动的生成式AI功能,如今已经相当高调地出现在了各大消费电子产品厂商的宣传中。而对于消费者来说,生成式AI的“实际价值”除了对话、问答,以及部分生产力场景可能有用的内容总结、归纳之外,最能被大家广泛接受的,恐怕还是将其用在影像处理领域的各种“生成式拍照”和“修图”功能。

来自主题: AI资讯
6612 点击    2025-02-11 11:04
DeepSeek惊醒上海,输不起的人工智能之战

DeepSeek惊醒上海,输不起的人工智能之战

DeepSeek惊醒上海,输不起的人工智能之战

上海拥有全国1/3的人工智能重点企业、41%的智能芯片产能和日均处理的20PB级城市数据,却在2025年伊始遭遇了尴尬的叩问: 一家总部杭州的初创公司DeepSeek横空出世,其开源大模型的开发者调用量在一周内突破微软亚洲研究院十年累积量,直接促成全球170个国家开发者建立起47万个衍生模型

来自主题: AI资讯
5951 点击    2025-02-10 20:21
Deepseek妙语连珠,是否触达了人类语言的根源?

Deepseek妙语连珠,是否触达了人类语言的根源?

Deepseek妙语连珠,是否触达了人类语言的根源?

当我们惊叹于Deepseek的妙语连珠时,是否正目睹硅基系统对人类语言本源的复刻?那在服务器集群中奔流的矩阵运算,与人脑皮层间跳跃的神经电波,究竟共享着怎样的“语言密码”?

来自主题: AI资讯
7855 点击    2025-02-10 20:05
人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

人大刘勇团队「慢思考」机理分析:从雪球误差到正确推理概率

「慢思考」(Slow-Thinking),也被称为测试时扩展(Test-Time Scaling),成为提升 LLM 推理能力的新方向。近年来,OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布,进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报
5750 点击    2025-02-10 17:04
诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

诺奖得主DeepMind CEO放话:DeepSeek是中国最好AI模型,但没任何科学进步

xAI、谷歌DeepMind和Anthropic的CEO们纷纷对DeepSeek的技术创新性提出质疑,认为其并未带来实质性的科学突破。AI大佬纷纷泼冷水,到底是技术讨论还是各怀目的?

来自主题: AI资讯
8662 点击    2025-02-10 16:50
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?

来自主题: AI资讯
9634 点击    2025-02-10 11:21
图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成推理大模型,港中文北大等联手破解画质提升难题

图像生成模型,也用上思维链(CoT)了!此外,作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。(Potential Assessment Reward Model,PARM)及其增强版本PARM++。

来自主题: AI技术研报
6169 点击    2025-02-10 11:09
车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

当ChatGPT用对话颠覆人机交互时,车企们早已嗅到了AI大模型的潜力——从语音助手到自动驾驶,从情感陪伴到场景决策,智能座舱的体验边界正被重新定义。

来自主题: AI资讯
9550 点击    2025-02-10 11:04
DeepSeek爆火,国内同行度过了一个痛苦的春节

DeepSeek爆火,国内同行度过了一个痛苦的春节

DeepSeek爆火,国内同行度过了一个痛苦的春节

DeepSeek让国内一众大模型同行度过了一个“痛苦”的春节。年前,DeepSeek掀起AI海啸,有某大厂大模型业者就捶胸顿足:“产品超出了我的想象,比咱家的各方面都好,真想跳槽到DeepSeek。”还有很多人反思,为啥咱自家就没做出DeepSeek。也有业者不服气,认为“它的火只是一种情绪的泡沫。”

来自主题: AI资讯
7135 点击    2025-02-09 09:48