Meta FAIR田渊栋唯一作者发文:拆解模型「顿悟时刻」
Meta FAIR田渊栋唯一作者发文:拆解模型「顿悟时刻」早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛化。
早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛化。
就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,牛津大学尹榛菲,Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破
一夏天,马斯克一头扎进xAI,誓要追赶OpenAI。结果呢?内部重组大戏上演,夺走实权高管跳槽。内部会议上,马斯克豪言打造「巨硬」剑指微软,还预告了儿童版「Baby Grok」。
就在昨天深夜,马斯克的 xAI 悄无声息地扔出了一颗重磅炸弹——Grok 4 Fast!
Gemini核心开发者Dustin Tran昨日官宣跳槽xAI!马斯克也已转发推文确认。在谷歌的8年,从Gemini 1到最新尚未公布的Gemini,背后都有他的身影。他的到来,能为Grok带来哪些变化?
xAI重磅推出Grok 4 Fast,创新融合推理与非推理双模式,支持200万token上下文。在NYT Connections基准和AA智能指数中表现卓越,超越多家顶级模型,标志着AI智能获取门槛的进一步降低。
顶级大模型在AAI提出的FormulaOne基准集体翻车:三层难度递进,GPT-5进阶题仅约4%正确,最深层零分;Grok 4、o3 Pro全部失手。该基准以图上MSO逻辑与动态规划生成问题,贴近路径规划等现实优化,旨在衡量超越竞赛编程的算法推理深度。
什么情况,帮马斯克训练大模型的人说失业就失业了?上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
最强不敢说,但最快实锤了! 刚刚,xAI发布Grok 4 Fast,生成速度高达每秒75个 token,比标准版快10倍! 从下面的动图中,我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”,Grok 4 Fast已经在说:“下一个问题是什么了。”
表面上,AI正在狂飙突进;但背后,却是一群「看不见的人」在默默撑起这场科技竞赛。马斯克的xAI大规模裁员转型专家标注,谷歌外包工人被迫处理负面暴力内容。AI是靠无数普通人的劳动堆出来的。