曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考
曝GPT-4.5本周空降!1T激活参数,120T训练数据,会吐出阶段性思考成果然后继续思考嚯,万众期待的GPT-4.5,本周就要空降发布?!部分用户的ChatGPT安卓版本(1.2025.056 测试版)上,已经出现了“GPT-4.5研究预览(GPT-4.5 research preview)”的字样。
嚯,万众期待的GPT-4.5,本周就要空降发布?!部分用户的ChatGPT安卓版本(1.2025.056 测试版)上,已经出现了“GPT-4.5研究预览(GPT-4.5 research preview)”的字样。
最新消息,斯隆奖得主、姚班校友马腾宇大模型创业成果,被收购! 收购方是MongoDB,一家开源数据库上市龙头。
尽管 OpenAI 和 Anthropic 的收入倍数在过去一年中下降,但 AI 应用开发者如 Perplexity 和 Writer 的收入倍数却上升,分析显示了十几家 AI 初创公司的估值和收入增长情况。
企业在设计和优化供应链时面临着各种复杂挑战,提升应变能力、降低成本和提高规划质量只是其中几个方面。过去几十年里,信息技术的进步使企业决策从依靠直觉和经验,转向了更加自动化和数据驱动的方法,从而提高了效率,大幅降低成本,并提升了客户服务。
DeepSeek开源第二弹如期而至。这一次,他们把MoE模型内核库开源了,支持FP8专为Hopper GPU设计,低延迟超高速训练推理。
AI竞争:数据为关键,OpenAI领先缩小。
近日,Meta等机构发表的论文介绍了一种通过进化算法构造高质量数据集的方法:拒绝指令偏好(RIP),得到了Yann LeCun的转赞。相比未经过滤的数据,使用RIP构建的数据集让模型在多个基准测试中都实现了显著提升。
数据库公司 MongoDB Inc.宣布,将以 2.2 亿美元的现金加股票交易收购 Voyage AI,以加速其帮助客户构建人工智能驱动应用程序的能力。
还在惊叹预言家的神奇?如今LLM也掌握了预测未来的「超能力」!研究人员通过自我博弈和直接偏好优化,让LLM摆脱人工数据依赖,大幅提升预测能力。
DeepSeek-R1背后关键——多头潜在注意力机制(MLA),现在也能轻松移植到其他模型了!