
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。
在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每一代GPU架构都以历史上杰出的科学家命名。这些名字背后,不仅凝聚了人类科学智慧的巅峰成就,也寄托着Nvidia对科技创新的致敬与传承。
SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合蒸馏策略,SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像,在速度和质量的权衡方面树立了新的标杆。
当前,医疗保健和生命科学领域,人工智能的采用非常强劲。
当开车遇到变道、加塞等场景时,驾驶员往往会下意识地激活自己的“安全驾驶思维”,从而做出激进的规避行为。
贾扬清创业公司LeptonAI,要卖给英伟达了?
巨头英伟达,即将收购阿里前副总裁贾扬清的初创Lepton AI,交易价值或达数亿美元!而Lepton AI,仅仅创立两年。
在基于物理世界的真实场景进行视觉问答时,有可能出现参考选项中没有最佳答案的情况,比如以下例子:
2025年3月18日,英伟达年度技术大会(GTC)在美国圣何塞开幕,CEO黄仁勋以"AI推理时代"为核心,发布了重磅技术与合作计划,涵盖硬件架构、软件生态、量子计算、机器人技术及行业应用。与往年不同,2025 GTC英伟达转变重心,从去年的"AI训练"转向"推理与部署"的行业转型。
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。