吴恩达、Karpathy 天使轮，微软、SpaceX抢购，Inception到底什么来头？

7849点击 2026-05-18 17:54

吴恩达、Karpathy 天使轮，微软、SpaceX抢购，这家初创公司到底什么来头？

扩散模型杀进了文本生成的地盘，而巨头们为了抢它，已经打起来了。

在 AI 疯狂发展的当下，在一片狂热之下，行业同样在担心一个根本问题——LLM 是否已经走到头了？会不会有新的架构诞生，造就出新的 AI 王者。

5 月 13 日，外媒爆出一条消息，微软正在和一家叫 Inception 的小公司谈收购。就在同一天，马斯克的 SpaceX，也在追求这家公司。

一家吴恩达、Karpathy 做天使投资人、种子轮才拿了 5000 万美元的创业公司，现在开价超过 10 亿美元——溢价 20 倍。微软和 SpaceX 两个万亿级巨头同时下场争抢，抢的不是什么成熟业务，是一支斯坦福教授团队和一条几乎没人走过的技术路线。

这家和诺兰的《盗梦空间》用一样名字的初创团队，到底有什么不同凡响之处？

01 三个教授和一个「异端」想法

Inception 的故事，要从它的创始人 Stefano Ermon 说起。

Ermon 是斯坦福大学计算机科学教授，但他更重要的身份是——扩散模型（Diffusion Model）的共同发明人。大家今天用的 Midjourney、Sora、Stable Diffusion，底层都跑着他帮助开创的技术。他关于文本扩散的论文拿过 ICML 2024 最佳论文奖。

2024 年中，Ermon 从斯坦福休假，拉上了两个合作超过 10 年的老搭档——UCLA 教授 Aditya Grover 和 Cornell 教授 Volodymyr Kuleshov，在 Palo Alto 创立了 Inception Labs。

这三个人有一个在当时看来相当「异端」的想法：把扩散模型从图像领域搬到文本生成领域，彻底替换掉自回归架构。

Andrej Karpathy 在 Inception 发布第一个模型时就在 X 上表达了兴趣。他说，今天几乎所有 LLM 在核心建模方法上都是「克隆体」，都是从左到右逐个预测 token。扩散模型完全不同——它不是从左到右生成，而是从噪声中逐步去噪，最终得到一个完整的 token 序列。他觉得这个模型「有潜力展现全新的、独特的能力特征」，鼓励大家去试。

Karpathy 不只是嘴上说说。他和吴恩达（Andrew Ng）都以天使投资人身份参与了 Inception 的种子轮。

2025 年 11 月，Inception 完成了 5000 万美元种子融资，Menlo Ventures 领投，NVIDIA 旗下 NVentures、微软旗下 M12、Snowflake Ventures、Databricks 投资部门全部跟投。

当 Karpathy 和吴恩达同时押注一家公司，当 NVIDIA 和微软的战投基金同时出现在投资人名单上，这基本上是 AI 领域最顶级的背书组合了。

02 快 10 倍，便宜 10 倍

要理解 Inception 为什么值钱，得先理解它的技术路线为什么不一样。

今天大家用的 ChatGPT、Claude、Gemini，底层全是自回归模型（Autoregressive Model）。它们生成文本的方式是：一个 token 接一个 token，从左到右，串行输出。每生成一个字之前，必须等前面所有字都生成完。

就像一个人写文章，只能一个字一个字地往后写，绝对不能跳着写。

这个方法很可靠，但有一个结构性天花板——速度被串行生成锁死了。你可以换更好的芯片，可以优化推理框架，可以压缩模型，但只要本质上还是逐 token 生成，速度就有上限。

Inception 选了一条完全不同的路。它用扩散模型做文本生成——不是逐字写，而是先给出一个「粗略草稿」，然后通过神经网络反复精炼，同时修改多个 token，并行输出。

Ermon 的原话很直白：「这是一种根本不同的方法。所有现有的大语言模型都是自回归的，一个接一个地从左到右生成文本或代码，这非常慢，因为你不能在生成前面所有内容之前生成后面的东西。」

吴恩达、Karpathy 天使轮，微软、SpaceX抢购，这家初创公司到底什么来头？

Mercury 2 模型在每秒 token 输出上比流行的小模型更快｜图片来源：Inception

实际效果呢？Inception 推出的模型家族叫 Mercury。2026 年 2 月发布的 Mercury 2，根据第三方评测机构 Artificial Analysis 的测试，输出吞吐量大约在每秒 1000 个 token。作为对比，Claude 4.5 Haiku 大约是每秒 89 个 token，GPT-5 Mini 大约是每秒 71 个 token。快了差不多 10 到 14 倍。

在质量上，Mercury 2 的 AIME 2025 得分 91.1，GPQA 得分 73.6，LiveCodeBench 得分 67.3。这些分数和 Claude 4.5 Haiku、GPT-5.2 Mini 在同一个竞争区间，但吞吐量是后者的 10 倍以上。

Ermon 对此也很坦诚——Mercury 2 对标的是 Haiku 和 Flash 这个级别的模型，不是 Claude Opus 或 GPT-4 这种旗舰。第三方分析也指出，在复杂推理任务上，扩散模型的质量大约是前沿自回归模型的 85%-95%，但在结构化输出和翻译任务上基本持平。

但这恰恰是它最有想象力的地方。 如果扩散模型的质量差距只有 5%-15%，而速度优势是 10 倍，那在大量对延迟敏感的场景里——实时语音交互、代码自动补全、游戏对话、Agent 循环调用——扩散模型就是更实际的选择。

吴恩达、Karpathy 天使轮，微软、SpaceX抢购，这家初创公司到底什么来头？

代码构建上 Mercury2 模型只用迭代 14 次，而其他模型要迭代 87 次｜图片来源：Inception

而且，扩散框架还带来几个自回归模型做不到的结构性优势。

第一，输出可控性更强。扩散模型能天然遵循特定的 schema 和语义约束，生成符合指定格式的 JSON 输出，这在企业级应用里极其重要。

第二，天然支持多模态融合。扩散本来就是图像和视频生成的底层范式，现在把它扩展到文本，等于用一套统一框架处理语言、图像、音频、视频，不用再拼接不同架构。

第三，内置纠错能力。自回归模型一旦前面写错了，后面很难纠正；扩散模型可以在精炼过程中反复修正，理论上能减少幻觉。

当然，这条路线也有明显的不确定性。一些 AI 研究者指出，扩散方法让输出预测更加困难，它的 Scaling Law 还没有被充分验证——自回归模型「参数越多、数据越多、效果越好」的规律花了好几年才摸清，扩散模型是否遵循类似的规律，还是需要完全不同的优化策略，目前没有定论。

但正是这种不确定性，才让它有可能成为下一个范式。

03 「后 OpenAI 时代」的军备竞赛

理解了 Inception 的技术，再来看为什么微软和 SpaceX 同时抢它，逻辑就清楚了。

2026 年 4 月 27 日，微软和 OpenAI 官宣了合作关系的重大调整。微软对 OpenAI 模型的 IP 授权从独家变成非独家，有效期延到 2032 年。微软不再向 OpenAI 支付收入分成。OpenAI 可以在 AWS、Google Cloud 等任何云平台上提供服务。AGI 条款被彻底删除。

这段曾经被称为「科技界最佳 Bromance」的关系，实质上已经变成了「管理型竞争」。

微软在 OpenAI 身上花了超过 130 亿美元投资，还有大量 Azure 算力支持。但现在，OpenAI 不再是微软的「独家武器」，而微软也在加速摆脱对 OpenAI 的依赖。据报道，微软正在开发自己的通用 AI 模型，目标是 2027 年之前推出能和 OpenAI、Anthropic 正面竞争的前沿模型。

收购 AI 创业公司，就是这个战略的一部分。

路透社的报道披露，微软今年春天先看上了代码生成公司 Cursor，但因为自己有 GitHub Copilot，内部担心反垄断审查过不了，主动放弃了。SpaceX 随后立刻和 Cursor 签了一份 600 亿美元的收购期权协议——如果收购不成，SpaceX 也要付 100 亿美元的合作费。

微软放弃 Cursor 后，转向了 Inception。但 SpaceX 也盯上了 Inception。Inception 已经聘请了投行来操盘交易谈判，开价超过 10 亿美元。

SpaceX 的介入让整件事更有趣。

2026 年 2 月，SpaceX 以全股票交易方式收购了 Musk 的 xAI，两家公司合并后估值 1.25 万亿美元。这是有史以来估值最高的商业并购。SpaceX 随后又启动了 Terafab 半导体工厂项目，与 Tesla 和 xAI 联合建设。再加上收购 Cursor 的期权和对 Inception 的追求，Musk 显然在用 SpaceX 作为平台，系统性地构建一个从芯片到模型到应用的完整 AI 技术栈。

而微软这边，除了追求 Inception 之外，也在同时和多家 AI 创业公司接触。路透社引述知情人士称，AI 研究人员现在轻松就能拿到数千万美元的薪酬，创业公司估值在投资者的疯抢下飞速上涨。

Menlo Ventures 合伙人 Tim Tully 在 Inception 融资时说过一句话，放在今天的收购大战背景下格外应景。他说，Inception 的团队证明了扩散式 LLM 不只是一个研究突破，而是「一个可以构建可扩展、高性能语言模型的基础，企业今天就能部署」。

这句话解释了一切——巨头们抢的不是一家公司，是一个可能改写游戏规则的技术范式，以及掌握这个范式的那几个人。

当微软和 OpenAI 的「婚姻」走向开放式关系，当 SpaceX 从火箭公司变成 AI 收购机器，当一家种子轮公司被两个万亿巨头同时争抢——这场「后 OpenAI 时代」的军备竞赛，才刚刚开始。

而 Inception 的命运，无论最终花落谁家，都已经证明了一件事：在 AI 的世界里，真正稀缺的从来不是资本，而是敢走不同路线的人。

文章来自于"极客公园"，作者 "桦林舞王"。

关键词: AI新闻 , Inception , 扩散模型 , Mercury 2

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales