
R2模型呼之欲出,「卷王」DeepSeek继续给巨头上压力
R2模型呼之欲出,「卷王」DeepSeek继续给巨头上压力属于OpenAI的时代结束了?
属于OpenAI的时代结束了?
央视新闻报道:最近,DeepSeek火爆出圈,人工智能热度再上新高。记者发现,一些大学生对AI工具产生了依赖,不当使用正呈上升趋势。某高校大一年级英语作业群里发布一份通告,老师将利用AI工具直接生成的作文全部判了零分。
2月12日,DeepSeek迎来全球首场诉讼,印度德里高等法院受理了一项公益诉讼(PIL)。公益诉讼申请人律师Bhavna sharma与Nihit Dalmia在诉讼向法院提出禁令,请求印度政府限制DeepSeek在印度提供服务。
风险投资行业中,古典 VC 在科技创新浪潮中捕捉机会追求胜率,讲究品牌效应、二八原则和师徒传承。过去几年,VC 行业集体丧失贝塔,无法抓住阿尔法的 VC 已经被汰换,传统 VC 模式的弊端也逐渐暴露。VC 模式的换代迎来了 Deepseek 时刻。
STP(自博弈定理证明器)让模型扮演「猜想者」和「证明者」,互相提供训练信号,在有限的数据下实现了无限自我改进,在Lean和Isabelle验证器上的表现显著优于现有方法,证明成功率翻倍,并在多个基准测试中达到最先进的性能。
DeepSeek最后一天,送上了3FS文件并行系统,以及数据处理框架Smallpond。五天开源连更,终于画上了完美的句号。
随着 AI 能力的提升,一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和,比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。
“用DeepSeek写小说,一天能写20万字”
AI模型的训练和推理成本在过去18个月内大幅下降,达到180倍的成本降低。这一趋势推动了更多开源项目的涌现。
DeepSeek开源周的最后一天,迎来的是支撑其V3/R1模型全生命周期数据访问需求的核心基础设施 — Fire-Flyer File System(3FS) 和构建于其上的Smallpond数据处理框架。