AI资讯新闻榜单内容搜索-CV

单目三维检测实时泛化，纯视觉自动驾驶鲁棒感知方法入选ECCV 2024

全自动驾驶系统的纯视觉方案如特斯拉 “Tesla Vision”，仅依赖于摄像头收集的图像数据，旨在实现高效且成本效益高的自动驾驶技术。

来自主题: AI资讯

4809 点击 2024-10-04 12:39

ECCV'24论文提出跨域小样本物体检测新数据集｜已开源

解决跨域小样本物体检测问题，入选ECCV 2024。

来自主题: AI技术研报

10148 点击 2024-10-02 11:56

ECCV2024 Oral | 第一视角下的动作图像生成，Meta等提出LEGO模型

如何基于用户的问题和当前场景的照片，生成同一场景下的第一视角的动作图像，从而更准确地指导用户执行下一步行动？

来自主题: AI资讯

4421 点击 2024-10-02 11:22

ECCV 2024 oral | 首次基于深度聚类的多模态融合，上交、伯克利提出双向结构对齐的融合网络新SOTA！

视觉 / 激光雷达里程计是计算机视觉和机器人学领域中的一项基本任务，用于估计两幅连续图像或点云之间的相对位姿变换。它被广泛应用于自动驾驶、SLAM、控制导航等领域。最近，多模态里程计越来越受到关注，因为它可以利用不同模态的互补信息，并对非对称传感器退化具有很强的鲁棒性。

来自主题: AI技术研报

10478 点击 2024-09-22 14:00

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生，师从黄高副教授，主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报

6953 点击 2024-09-19 11:14

ECCV 2024 | 一眼临摹：瞥一眼就能模仿笔迹的AI

来自华南理工大学、新加坡国立大学、昆仑万维以及琶洲实验室的研究者们提出一种新的风格化手写文字生成方法，仅需提供单张参考样本即可临摹用户的书写风格，支持英文，中文和日文三种文字的临摹。

来自主题: AI资讯

11331 点击 2024-09-16 20:40

刚刚，CVPR 2025新规来了：审稿进入「半实名制」，不负责任的审稿人将被标记并拒稿

「25篇的上限，还是太多了！」

来自主题: AI资讯

7075 点击 2024-09-16 20:15

一张图实现街道级定位，端到端图像地理定位大模型AddressCLIP登ECCV2024

拔草星人的好消息来啦！中科院自动化所和阿里云一起推出了街景定位大模型，只要一张照片就能实现街道级精度的定位。

来自主题: AI资讯

5535 点击 2024-09-14 15:40

JHU上交等提出首个可渲染X光3DGS！推理速度73倍NeRF，性能提升6.5dB | ECCV 2024

X-Gaussian是一种新型的3D Gaussian Splatting框架，专为X光新视角合成而设计，以减少医疗成像中的X光辐射剂量，通过高效的渲染技术，能够在保持图像质量的同时显著减少训练时间和提升推理速度。

来自主题: AI技术研报

9890 点击 2024-09-11 17:42

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

9015 点击 2024-09-06 11:59