
曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考
曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考嚯,万众期待的GPT-4.5,本周就要空降发布?!部分用户的ChatGPT安卓版本(1.2025.056 测试版)上,已经出现了“GPT-4.5研究预览(GPT-4.5 research preview)”的字样。
嚯,万众期待的GPT-4.5,本周就要空降发布?!部分用户的ChatGPT安卓版本(1.2025.056 测试版)上,已经出现了“GPT-4.5研究预览(GPT-4.5 research preview)”的字样。
相信很多用户已经见识过或至少听说过 Deep Research 的强大能力。
尽管 OpenAI 和 Anthropic 的收入倍数在过去一年中下降,但 AI 应用开发者如 Perplexity 和 Writer 的收入倍数却上升,分析显示了十几家 AI 初创公司的估值和收入增长情况。
AI竞争:数据为关键,OpenAI领先缩小。
高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!
Stop AI组织在旧金山抗议AGI发展,呼吁禁止。
正如乔布斯所言:“仙童像成熟的蒲公英,创业精神的种子随风播撒。”如今,这句话放在OpenAI上可能再合适不过,最新成立的AI公司Thinking Machines有近2/3的员工,来自AI巨头OpenAI这棵蒲公英上。
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步!