AI资讯新闻榜单内容搜索-DeepSeek开源

DeepSeek第五天开源猛料，3FS并行文件系统榨干SSD！6.6 TiB/s吞吐量堪比光速

DeepSeek最后一天，送上了3FS文件并行系统，以及数据处理框架Smallpond。五天开源连更，终于画上了完美的句号。

来自主题: AI技术研报

4804 点击 2025-02-28 15:16

一文详解：DeepSeek 第五天开源的 3FS 文件系统

DeepSeek开源周的最后一天，迎来的是支撑其V3/R1模型全生命周期数据访问需求的核心基础设施 — Fire-Flyer File System(3FS) 和构建于其上的Smallpond数据处理框架。

来自主题: AI技术研报

8613 点击 2025-02-28 11:33

DeepSeek第五弹炸裂收官！开源全新并行文件系统，榨干SSD全部带宽

DeepSeek开源周，今日正式收官！内容依旧惊喜且重磅，直接公开了V3和R1训练推理过程中用到的文件系统。Fire-Flyer文件系统（简称3FS，第三个F代表File），一种利用现代SSD和RDMA网络的全部带宽的并行文件系统；

来自主题: AI资讯

9937 点击 2025-02-28 10:59

一文详解：DeepSeek 第四天开源的模型设计套件

第四天，DeepSee发布包括三个主要项目： DualPipe- 一种用于 V3/R1 训练的双向流水线并行算法，实现计算和通信完全重叠； EPLB(Expert Parallelism Load Balancer) - 专为 V3/R1 设计的专家并行负载均衡器； Profile-data- 分析 V3/R1 中计算与通信重叠的性能数据集。

来自主题: AI技术研报

10967 点击 2025-02-27 12:16

DeepSeek今日连开3源！针对优化的并行策略，梁文峰本人参与开发

按时整活！DeepSeek开源周第四天，直接痛快「1日3连发」，且全都围绕一个主题：优化并行策略。

来自主题: AI技术研报

10061 点击 2025-02-27 11:28

DeepSeek开源通用矩阵乘法库，300行代码加速V3、R1，R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 V3/R1 的训练和推理提供了支持，在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯

9456 点击 2025-02-26 10:58