AI资讯新闻榜单内容搜索-DeepSeeK

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: DeepSeeK
DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源全新并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。Fire-Flyer文件系统(简称3FS,第三个F代表File),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统;

来自主题: AI资讯
7959 点击    2025-02-28 10:59
我已确诊为“DeepSeek人格”:勿扰

我已确诊为“DeepSeek人格”:勿扰

我已确诊为“DeepSeek人格”:勿扰

AI还不够像人,人已经变成AI了

来自主题: AI资讯
8329 点击    2025-02-28 10:37
DeepSeek会是时代的破壁人吗?追问专访 | 上交大副教授林洲汉

DeepSeek会是时代的破壁人吗?追问专访 | 上交大副教授林洲汉

DeepSeek会是时代的破壁人吗?追问专访 | 上交大副教授林洲汉

在AI技术风起云涌的今天,名为DeepSeek的东方力量掀起骇浪。它如何打破常规,照亮AI行业的黑暗森林,又如何为中国的AI发展带来前所未有的临界点?

来自主题: AI资讯
7444 点击    2025-02-28 10:19
英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

英伟达下场,首次优化DeepSeek-R1!B200性能狂飙25倍,碾压H100

最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。

来自主题: AI技术研报
9365 点击    2025-02-27 16:33
DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

斯坦福和普林斯顿研究者发现,DeepSeek-R1生成的自定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到20%任务上超越PyTorch Eager基线,但GPU编程加速自动化的按钮,已经被按下!

来自主题: AI技术研报
9650 点击    2025-02-27 16:17
一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

一文详解:DeepSeek 第四天开源的模型设计套件

第四天,DeepSee发布包括三个主要项目: DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法,实现计算和通信完全重叠; EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器; Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报
8313 点击    2025-02-27 12:16