AI资讯新闻榜单内容搜索-GPU

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPU
台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电千亿美元投资美国!英伟达、博通秘密测试英特尔:谁输谁赢?

台积电豪掷千亿美元在美建厂,特朗普高调站台。与此同时,昔日霸主英特尔奋起直追,18A制程被寄予厚望,英伟达、博通等巨头秘密测试。代工大战硝烟再起!然而,18A制程的延期又为英特尔的复兴之路蒙上阴影。

来自主题: AI资讯
5883 点击    2025-03-04 19:51
韩国芯片,危险

韩国芯片,危险

韩国芯片,危险

2月26日,美光宣布已率先向生态系统合作伙伴及特定客户出货专为下一代CPU设计的 1γ(1-gamma) 第六代 (10纳米级) DRAM节点DDR5内存样品。

来自主题: AI资讯
4900 点击    2025-03-04 09:50
中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍

中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍

中国团队首次夺魁!无问芯穹FlightVGM获FPGA'25最佳论文,峰值算力超GPU21倍

国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息,今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM,这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作,同时也是亚太国家团队首次获此殊荣。

来自主题: AI资讯
8293 点击    2025-03-03 10:45
新加坡逮捕一名中国公民,被指控向DeepSeek走私Nvidia GPU

新加坡逮捕一名中国公民,被指控向DeepSeek走私Nvidia GPU

新加坡逮捕一名中国公民,被指控向DeepSeek走私Nvidia GPU

据新加坡本地媒体报道,新加坡警方逮捕了两名新加坡籍男子和一名中国公民,并指控这3人涉嫌绕过了美国贸易出口限制,非法向国内的DeepSeek公司走私Nvidia GPU。据路透社报道,新加坡警方和海关突击搜查了22个地点,总计逮捕了9人,并查获了相关文件和电子记录。

来自主题: AI资讯
8364 点击    2025-03-01 21:47
英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。

来自主题: AI技术研报
9344 点击    2025-02-27 16:33
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线,但GPU编程加速自动化的按钮,已经被按下!

来自主题: AI技术研报
9628 点击    2025-02-27 16:17
DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek开源通用矩阵乘法库,300行代码加速V3、R1,R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天(前两天报道见文末「相关阅读」)。今天开源的项目名叫 DeepGEMM,是一款支持密集型和专家混合(MoE)GEMM 的 FP8 GEMM 库,为 V3/R1 的训练和推理提供了支持,在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯
7080 点击    2025-02-26 10:58
一文详解:DeepSeek 第三天开源的 DeepGEMM

一文详解:DeepSeek 第三天开源的 DeepGEMM

一文详解:DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报
5938 点击    2025-02-26 10:46