AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

今天的大型视觉语言模型(VLM)做离线视频分析很强,但一到实时场景就尴尬: 视频在往前走,模型还在“补作业”。

来自主题: AI技术研报
6855 点击    2026-03-18 14:12
在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在具身智能的发展路径中,视觉 - 语言 - 动作(VLA)模型正逐步成为通用操作任务的核心框架。但当任务进入长程规划、柔性物体操作、精细双臂协同、动态交互等复杂场景时,VLA 仍然面临两个根本性挑战:

来自主题: AI技术研报
5461 点击    2026-03-18 14:05
离开meta三个月后的国内首访:田渊栋的科学与诗

离开meta三个月后的国内首访:田渊栋的科学与诗

离开meta三个月后的国内首访:田渊栋的科学与诗

作为Meta FAIR曾经的资深首席研究员,LLaMA和OpenGo背后的关键推手, 他的研究从破解围棋的机制到优化大模型的肌理, 做的事情从来只有一件:打开黑箱,找到底层逻辑。

来自主题: AI资讯
7916 点击    2026-03-18 13:55
阿里联手中山大学放狠话:75%的Agent都在造“屎山”!233天连环大测,代码库全崩了!自研新基准:GLM表现亮眼!网友:程序员饭碗保住了!

阿里联手中山大学放狠话:75%的Agent都在造“屎山”!233天连环大测,代码库全崩了!自研新基准:GLM表现亮眼!网友:程序员饭碗保住了!

阿里联手中山大学放狠话:75%的Agent都在造“屎山”!233天连环大测,代码库全崩了!自研新基准:GLM表现亮眼!网友:程序员饭碗保住了!

刚刚,一篇阿里联合中山大学的研究在 X 上爆火了!

来自主题: AI资讯
7804 点击    2026-03-18 13:54
如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

现如今,大模型越来越擅长在单轮对话中生成温柔体贴、情绪价值拉满的文字,然而,我们或许会怀疑:在一句句「高情商回复」的背后,模型是否真正理解了什么是共情。

来自主题: AI技术研报
7675 点击    2026-03-18 13:53
卡帕西点赞Transformer内置计算机!每秒3万Token吞吐,拿下世界最难数独

卡帕西点赞Transformer内置计算机!每秒3万Token吞吐,拿下世界最难数独

卡帕西点赞Transformer内置计算机!每秒3万Token吞吐,拿下世界最难数独

LLM推理已经顶尖,精确计算却跟不上。这局怎么破?卡帕西点赞的解决方法来了,在大模型内部构建一台原生计算机。新方法不搞外包那一套(不依赖任何外部工具),直接在Transformer权重里内嵌可执行程序。

来自主题: AI技术研报
8319 点击    2026-03-18 10:28
OpenClaw带火AI记忆,DeepMind用混合记忆把3D重建拉到近2万帧

OpenClaw带火AI记忆,DeepMind用混合记忆把3D重建拉到近2万帧

OpenClaw带火AI记忆,DeepMind用混合记忆把3D重建拉到近2万帧

过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」

来自主题: AI技术研报
9884 点击    2026-03-18 09:31
以「图」破局,HyperOffload定义超节点存储管理新范式

以「图」破局,HyperOffload定义超节点存储管理新范式

以「图」破局,HyperOffload定义超节点存储管理新范式

随着生成式 AI 迈入万亿参数时代,大语言模型(LLM)的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点(SuperNode)复杂的异构存储架构下,实现海量张量的高效管理和调度,已成为大模型落地的胜负手。

来自主题: AI技术研报
9797 点击    2026-03-18 09:30
笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?

3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Apache 2.0开源许可,还拿了日本经产省和NEDO的GENIAC项目补助。

来自主题: AI资讯
8380 点击    2026-03-17 23:46