
把两块芯片压成一块:EUV以来半导体制造的最大创新
把两块芯片压成一块:EUV以来半导体制造的最大创新在一平方毫米的硅片上建立数百万个连接。
来自主题: AI资讯
5058 点击 2024-08-12 17:35
在一平方毫米的硅片上建立数百万个连接。
跨GPU的注意力并行,最高提速8倍,支持512万序列长度推理。
有CPU就能跑大模型,性能甚至超过NPU/GPU!
一场未完成的投资改变了什么?
AI重新定义游戏体验的时代。
a16z的氧气计划
谷歌TPU核心团队创立,要做世界最快推理。
Groq又双叒给英伟达上压力了!不仅之前展现了每秒1256个token的破纪录输出速度,最新获得的一轮6.4亿美元融资更提供了在AI芯片领域挑战英伟达的底气。
Llama 3.1刚发布不久,Llama 4已完全投入训练中。 这几天,小扎在二季度财报会上称,Meta将用Llama 3的十倍计算量,训练下一代多模态Llama 4,预计在2025年发布。
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。