大模型的第一性原理:(一)统计物理篇
大模型的第一性原理:(一)统计物理篇白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家
白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家
从ChatGPT到DeepSeek,AI正沿着“智能+”的路径进入新一轮浪潮。
随着基础模型的日益成熟,AI领域的研发重心正从“训练更强的模型”转移到“构建更强的系统”。在这个新阶段,适配(Adaptation) 成为了连接通用智能与垂直应用的关键纽带。
今日凌晨,比OpenAI早一个小时,谷歌甩出了3个Agent大招:Deep Research Agent功能更新,并首次向开发者开放;开源新网络研究Agent基准DeepSearchQA,旨在测试Agent在网络研究任务中的全面性;推出新交互API(Interactions API)。
OpenAI十周年,那个地表最强的AI,又回来了!刚刚,OpenAI深夜炸场!GPT-5.2震撼发布,全球AI王座再次易主。新一代GPT-5.2「全家桶」直接把谷歌Gemini 3 Pro踩在脚下,专业实力更是堪比人类专家。
老板丢下一句“要高端大气”,然后转身就走。 面对空白的 PPT,你是不是也经常想把电脑砸了? 以前为了填这个坑,我得花几小时刷各种网站找素材。但最近,我摸到了 Google 的新神器 Mixboard。
见证历史!今天,首个由H100太空GPU训出LLM诞生了,它基于Karpathy nano-GPT训练。不仅如此,谷歌Gemma也在太空成功运行,向世界发出首句问候:地球人,你好。
2025 年 12 月的第二周,一则颇为吸睛的消息从东京传出:一家名为 Integral AI 的初创公司宣布,他们已经成功测试出“世界上第一个具备 AGI 能力的模型”。AGI,即 Artificial General Intelligence(通用人工智能),向来被视为 AI 领域的终极圣杯。
在AI医疗的技术路线和商业模式上,双方走向了不同的方向:百川押注语言模型和ToC,邓江拥抱多模态和ToB。
本该绽放的Llama 4黯然失色,Meta内部地震频发:首席AI科学家离职、600人裁员、顶级大佬空降、开源战略转向。最新模型Avocado被曝延期且套壳Qwen,扎克伯格如何在对手狂飙中绝地反击?