
速递|印度初创公司Ziroh Labs,推出无需高端芯片即可运行大型AI模型
速递|印度初创公司Ziroh Labs,推出无需高端芯片即可运行大型AI模型印度人工智能初创公司 Ziroh Labs ,与该国顶尖技术学院的研究人员合作,设计出一套经济实惠的系统,据称无需依赖英伟达公司等提供的高端计算芯片,即可运行大型 AI 模型。
印度人工智能初创公司 Ziroh Labs ,与该国顶尖技术学院的研究人员合作,设计出一套经济实惠的系统,据称无需依赖英伟达公司等提供的高端计算芯片,即可运行大型 AI 模型。
关税对算力产业链的影响正在产业链传导,H200终端涨价已成定局。之前英伟达设备是美禁止出口,并不是中国禁止进口,很多美国法律法规,中国根本不需要去遵守,所以H200 这些设备是正常报关,清关的。
谷歌首款AI推理特化版TPU芯片来了,专为深度思考模型打造。
谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌还带来了Veo 2等多款模型全新升级,就连「谷歌版」MCP协议也公布了。
Llama 4刚出世就被碾压!英伟达强势开源Llama Nemotron-253B推理模型,在数学编码、科学问答中准确率登顶,甚至以一半参数媲美DeepSeek R1,吞吐量暴涨4倍。关键秘诀,就在于团队采用的测试时Scaling。
UALink 1.0发布:支持1024 GPU,200GT/s带宽,开放标准挑战NVLink。
创立两年的Lepton AI被英伟达收入囊中!联创AI大牛贾扬清和白俊杰,已经加入收购方英伟达。这次收购将完善英伟达的AI投资布局。
CUDA 迎来 “Python元年”!
芯片架构设计的首要原则是明确取舍,决定哪些领域我们不追求卓越。
根据去年2024年7月28日Meta公司在训练大模型(Llama 3)时使用“16384 个 英伟达H100 GPU 集群”的经验,该显卡在高负载、大规模集群运行环境下容易出现以下故障点: