不让视觉语言模型「盲猜」,性能竟直接提升一倍?
不让视觉语言模型「盲猜」,性能竟直接提升一倍?近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
搜索
近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
随着AI技术的快速发展,许多重复性的设计工作,如图形用户界面设计和用户交互设计,正逐渐被自动化工具所取代。这一变革对于设计师而言,既是机遇也是挑战。
随着生物医学研究进入人工智能时代,如何运用AI前沿技术,深入挖掘中医药在肿瘤防治上的特色理论与实践经验,形成中西医融合的肿瘤防治新范式?这既是中西医学面临的共性难题,也是人工智能与信息科学面临的重大挑战。
近期,智驾行业出现了一个融合了视觉、语言和动作的多模态大模型范式——VLA(Vision-Language-Action Model,即视觉-语言-动作模型),拥有更高的场景推理能力与泛化能力。不少智驾人士都将VLA视为当下“端到端”方案的2.0版本。
智东西11月8日消息,据外媒The Information报道,亚马逊正讨论向美国AI大模型独角兽Anthropic进行第二笔数十亿美元的投资。
智东西11月8日报道,生成式AI的发展或将加剧电子垃圾问题。
Devin,全球第一款号称「AI程序员」的应用,号称可以完成从写代码、改bug,一直到部署上线运维的软件开发全流程。
瑞典AI初创公司Sana Labs在NEA领投的一轮融资中成功筹得5500万美元,估值达到5亿美元。这一成就不仅标志着资本市场对其技术实力的认可,也预示着人工智能在企业培训领域的新突破。
继金融后,央国企成了AI大模型先锋官
AI 学者拿下诺贝尔物理学奖、化学奖后,网友纷纷揶揄说: 下一个被 AI 攻陷的诺奖会是 ...... 文学奖。