
零开销,消除图像幻觉!基于零空间投影挖掘正常样本特征 | CVPR 2025
零开销,消除图像幻觉!基于零空间投影挖掘正常样本特征 | CVPR 2025当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。
当地时间 6 月 26 日,在上个月的 Google I/O 上首次亮相预览后,谷歌如今正式发布了 Gemma 3n 完整版,可以直接在本地硬件上运行。
在近日举办的2025年新领军者年会上,中国生物制药首席执行长谢承润接受媒体采访,并发表了AI在药物研发中应用的相关看法。
开年以来,AI 图片赛道迎来一轮小高潮。今年 3 月,在我们统计的月访问量超 200 万的 Web 端 AI 图片产品中,有 45 款产品访问量呈现环比上涨,最高增幅超过 600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。
Fuzozo、Haivivi……取个ABB名字就能爆? 要说2025年最火爆的赛道,潮玩绝对算一个。
还不如推倒重来。唱吧创始人陈华最近略感焦虑。他明显感觉AI应用有一大波机会要来,但此刻,自己却站在迷雾森林里,不能完全看清具体方向。
在 AI 成为全球共识之前,他已经坚定押注;在众人质疑深度学习时,他默默下注;在通用智能仍属“天方夜谭”的年代,他成为 OpenAI 最早的支持者之一。
本周五凌晨,谷歌正式发布、开源了全新端侧多模态大模型 Gemma 3n。谷歌表示,Gemma 3n 代表了设备端 AI 的重大进步,它为手机、平板、笔记本电脑等端侧设备带来了强大的多模式功能,其性能去年还只能在云端先进模型上才能体验。
中科院自动化所提出BridgeVLA模型,通过将3D输入投影为2D图像并利用2D热图进行动作预测,实现了高效且泛化的3D机器人操作学习。
ICCV 2025 将于 10 月 19 日至 25 日在美国夏威夷举行。刚刚,ICCV 官方向投稿者发送了今年论文接收结果的通知。