AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
林俊旸离职后首发文:我们为什么没把“思考+指令”合并好?

林俊旸离职后首发文:我们为什么没把“思考+指令”合并好?

林俊旸离职后首发文:我们为什么没把“思考+指令”合并好?

昨日晚间,前阿里千问大模型负责人林俊旸(Junyang Lin)在社交平台X上发表了《从“推理式思考”到“智能体式思考”(From "Reasoning" Thinking to "Agentic" Thinking)》的长文,引起AI技术产业圈关注。

来自主题: AI资讯
9459 点击    2026-03-27 13:41
全球顶尖大模型一夜惨遭血洗!最难AI测试人类拿满分,AI第一名得0.2%分

全球顶尖大模型一夜惨遭血洗!最难AI测试人类拿满分,AI第一名得0.2%分

全球顶尖大模型一夜惨遭血洗!最难AI测试人类拿满分,AI第一名得0.2%分

今夜,整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线,就把全球顶尖AI打到集体失声,人类满分通关,最强模型Opus 4.6得分仅0.2%,还不到1%。AI这是一夜被打回「原始人」了。

来自主题: AI资讯
7732 点击    2026-03-27 00:39
用SFT打出RL的效果?微软联合提出高效后训练算法

用SFT打出RL的效果?微软联合提出高效后训练算法

用SFT打出RL的效果?微软联合提出高效后训练算法

在大模型后训练阶段,监督微调(SFT)和强化学习(RL)是两根不可或缺的支柱。SFT 利用高质量的离线(Off-policy)数据快速注入知识,但受限于静态数据分布,泛化能力往往容易触及天花板并带来灾难性遗忘;RL 则允许模型在探索中不断自我迭代,产生与当前策略同分布(On-policy)的数据,上限极高,但往往伴随着训练极度不稳定、计算资源消耗巨大的痛点。

来自主题: AI技术研报
5331 点击    2026-03-26 10:47
对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长,海量 KV Cache 存储需求急剧增加,各类 KV Cache 压缩方法如雨后春笋般涌现。然而,这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报
8916 点击    2026-03-25 13:41
腾讯挖来多位字节Seed骨干,向姚顺雨汇报丨智能涌现独家

腾讯挖来多位字节Seed骨干,向姚顺雨汇报丨智能涌现独家

腾讯挖来多位字节Seed骨干,向姚顺雨汇报丨智能涌现独家

据接近腾讯混元团队的知情人士透露,原字节Seed视觉AI平台团队负责人肖学锋,Infra团队张弛于近期低调入职腾讯,负责大模型Infra相关工作,向腾讯首席AI科学家姚顺雨汇报。

来自主题: AI资讯
8108 点击    2026-03-24 22:32
鼠标点3下就能锁定打击?五角大楼曝光美军AI大脑

鼠标点3下就能锁定打击?五角大楼曝光美军AI大脑

鼠标点3下就能锁定打击?五角大楼曝光美军AI大脑

当大众还在热衷于让大模型编代码、写周报或者生成搞笑图片时,硅谷最顶尖的AI技术,已经悄悄渗入了五角大楼的「杀伤链」。

来自主题: AI资讯
9540 点击    2026-03-23 14:12