AI资讯新闻榜单内容搜索-CV

CVPR 2026最热方向，被一家杭州团队率先跑进了端侧！

刚刚，Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景，总共三款模型，三天连发：这三款模型连起来，不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。

来自主题: AI技术研报

9059 点击 2026-06-28 11:14

扩散模型自引导新范式：直接交换token就能变强！ | CVPR‘26 Oral

扩散模型又被玩出新花样了。

来自主题: AI技术研报

8351 点击 2026-06-25 15:00

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA

依赖于有限机器人数据和大量人类数据，也能让 VLA 模型更稳健吗？

来自主题: AI技术研报

5736 点击 2026-06-24 10:30

入选ECCV 2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

在机器人、自动驾驶、AR等真实场景中，空间理解从来都不是“看一眼图像”就能解决的问题。

来自主题: AI技术研报

6143 点击 2026-06-22 15:16

视频生成作为多模态推理新范式 | CVPR 2026

被CVPR 2026收录！

来自主题: AI技术研报

9828 点击 2026-06-15 09:47

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧，扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像，却无法回答场景中有哪些目标、目标位于何处，以及不同视角下的空间结构如何变化，那么它仍然缺少对三维驾驶环境的显式建模能力。

来自主题: AI技术研报

9369 点击 2026-06-15 09:18

CVPR 2026 | 视觉脑机迈向双向交互！神经流模型 NeuroFlow 打通视觉与神经的双向通道

来自上海人工智能实验室、香港大学、香港中文大学等机构的研究团队，提出首个基于统一神经流模型的视觉-神经双向建模框架NeuroFlow，相关成果入选 CVPR 2026。它首次将视觉编码（写脑）与解码（读脑）整合到同一可逆流结构中，打通视觉感知与神经活动之间的双向通路，为理解人类视觉认知机制、构建下一代通用视觉假体与双向脑机接口提供了全新范式。

来自主题: AI技术研报

7749 点击 2026-06-13 10:12