AI资讯新闻榜单内容搜索-人工智能

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 人工智能
超越免训练剪枝:LightVLA引入可微分token剪枝,首次实现VLA模型性能和效率的双重突破

超越免训练剪枝:LightVLA引入可微分token剪枝,首次实现VLA模型性能和效率的双重突破

超越免训练剪枝:LightVLA引入可微分token剪枝,首次实现VLA模型性能和效率的双重突破

LightVLA 是一个旨在提升 VLA 推理效率且同时提升性能的视觉 token 剪枝框架。当前 VLA 模型在具身智能领域仍面临推理代价大而无法大规模部署的问题,然而大多数免训练剪枝框架依赖于中间注意力输出,并且会面临性能与效率的权衡问题。

来自主题: AI技术研报
5196 点击    2025-09-27 11:25
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈

缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈

缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈

视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。

来自主题: AI技术研报
6885 点击    2025-09-27 11:13
NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数

NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数

NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数

在三维重建、NeRF 训练、视频生成等任务中,相机参数是不可或缺的先验信息。传统的 SfM/SLAM 方法(如 COLMAP)在静态场景下表现优异,但在存在人车运动、物体遮挡的动态场景中往往力不从心,并且依赖额外的运动掩码、深度或点云信息,使用门槛较高,而且效率低下。

来自主题: AI技术研报
5855 点击    2025-09-27 10:58
攻克结构化长文档检索难题!新框架让模型告别“结构性失明”

攻克结构化长文档检索难题!新框架让模型告别“结构性失明”

攻克结构化长文档检索难题!新框架让模型告别“结构性失明”

AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑?解决方案来了——SEAL全新对比学习框架通过带结构感知+元素对齐,让模型更懂长文。

来自主题: AI技术研报
5479 点击    2025-09-27 10:43
首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

开源框架实现100%可复现的稳定RL训练!下图是基于Qwen3-8B进行的重复实验。两次运行,一条曲线,实现了结果的完美重合,为需要高精度复现的实验场景提供了可靠保障。这就是SGLang团队联合slime团队的最新开源成果。

来自主题: AI技术研报
5477 点击    2025-09-27 10:19
Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生

Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生

Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生

2016年,Hinton曾建议停止培训放射科医生,因为他们在未来五年中很可能被AI取代。如今已快九年,美国放射科医生不仅没有被AI取代,而且还以52万美元的平均年薪成为全美第二高薪的医疗专业,岗位数量也创下历史新高。

来自主题: AI资讯
6614 点击    2025-09-27 10:18
谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

谁是最强“打工AI”?OpenAI亲自测试,结果第一不是自己

OpenAI发布最新研究,却在里面夸了一波Claude。他们提出名为GDPval的新基准,用来衡量AI模型在真实世界具有经济价值的任务上的表现。具体来说,GDPval覆盖了对美国GDP贡献最大的9个行业中的44种职业,这些职业年均创收合计达3万亿美元。任务基于平均拥有14年经验的行业专家的代表性工作设计而成。

来自主题: AI技术研报
9260 点击    2025-09-26 16:03
给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

给几何图片写标题就能让AI更聪明,UIUC发布高质量可泛化几何数据集

随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。 然而,现有方法大多依赖模板生成图像 - 文本对,泛化能力有限,且视

来自主题: AI技术研报
5589 点击    2025-09-26 13:30
AI片子,真的登上了釜山电影节!

AI片子,真的登上了釜山电影节!

AI片子,真的登上了釜山电影节!

我一个 AI 圈的,为啥会关注到电影圈呢?倒不是因为我爱看电影,而是因为电影节的放映单元,突然冒出来了我们圈子里几个“老熟人”:Seedream(图像创作模型)、Seedance(视频生成模型)、即梦 AI。

来自主题: AI资讯
8116 点击    2025-09-26 10:52
Flowith 画布全新升级,让创意在 Context PlayGround 上尽情流动

Flowith 画布全新升级,让创意在 Context PlayGround 上尽情流动

Flowith 画布全新升级,让创意在 Context PlayGround 上尽情流动

最近 flowith 推出了全新画布,交互形态全新升级,现在 AI 生成的任意内容,都可以被很方便的右键点击节点,存入任意知识库,后续工作都可以调用。说实话,flowith 是一款上手门槛比较高的产品,它不像一般对话式的 ChatBot 那样简单,

来自主题: AI资讯
8646 点击    2025-09-26 10:51