
NVIDIA Tensor Core 的演变:从 Volta 到 Blackwell
NVIDIA Tensor Core 的演变:从 Volta 到 Blackwell在我们去年 AI Scaling Laws article from late last year中,我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展,使得模型能力的增长速度超过了摩尔定律,并且单位 token 成本也相应地迅速降低。
在我们去年 AI Scaling Laws article from late last year中,我们探讨了多层 AI 扩展定律如何持续推动 AI 行业向前发展,使得模型能力的增长速度超过了摩尔定律,并且单位 token 成本也相应地迅速降低。
英伟达,亲手打破了自己的天花板!刚刚,Blackwell单用户每秒突破了1000个token,在Llama 4 Maverick模型上,再次创下了AI推理的世界纪录。在官博中,团队放出了不少绝密武器。
在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每一代GPU架构都以历史上杰出的科学家命名。这些名字背后,不仅凝聚了人类科学智慧的巅峰成就,也寄托着Nvidia对科技创新的致敬与传承。
老黄在GTC 2025大会上,再次亮出了英伟达未来GPU路线图。随着推理token的暴增,AI计算需要全新的范式,下一代BlackWell Ultra、Vera Rubin就是最强的回应。
Blackwell刚开始大规模发货,科技界已经将目光投向了下一代「Rubin」。英伟达的GTC开发者大会,从昔日9000人到如今被戏称为「AI Woodstock」的25000人狂欢,英伟达早已建立起自己的AI帝国!本周黄仁勋将带来哪些惊喜?Rubin会否再掀性能革命?
最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。
华尔街屏息凝神,硅谷一夜无眠。
本周三,各路媒体对英伟达 GeForce RTX 5090 的评测宣告解禁。基于最新 Blackwell 架构,新一代旗舰显卡无疑将成为未来几年你能买到的最好的显卡。
2025年1月7日上午,在CES大会开幕式上,身穿黑皮衣的英伟达创始人黄仁勋,用一番激情演讲,拉开了新一年AI的大幕——英伟达不仅推出了新一代基于Blackwell架构的GPU RTX 5090,还发布了开源可商用的世界基础模型Cosmos。两项产品,为AI应用的变革提供了全新的“基础设施”。
2025 CES上最具话题性的两家公司,都谈到了AI PC的核心话题。 在通过新一代Blackwell 架构的英伟达 RTX 5090 显卡炸场后,黄仁勋彻底点燃了CES开场情绪。但其后,他依然不得不在会后交流中回应关于AI PC“销量没能起飞”的尖锐话题。