谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺
8323点击    2025-11-19 10:14

凌晨,谷歌终极杀器Gemini 3重磅来袭,一出手就是Pro顶配版,号称「史上最强推理+多模态+氛围编程」三合一AI战神!基准测试横扫全场,就连GPT-5.1也被斩于马下,AI的下一个时代开启。


它来了,它来了!


就在刚刚,万众期待的年度压轴之王,谷歌新一代旗舰Gemini 3炸裂登场。


而且,一上来就是顶配的Gemini 3 Pro——


迄今推理最强,多模态理解最强,以及「智能体」+「氛围编程」最强的模型!


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


强到什么程度?


发布一小时后,就连OpenAI CEO奥特曼,都亲自发推表示祝贺!


而且,还是区分大小写的版本。(不知道是不是亲自试了一下)


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


从实测来看,也的确如此。


在众多基准测试中,Gemini 3 Pro一举封神——


不仅相较于2.5 Pro实现了性能的全方位跃升,甚至直接把OpenAI刚上新的GPT-5.1甩出了好几条街。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


用谷歌的话来总结,Gemini 3 Pro顶尖的核心在于这三点——


  • 霸榜LMArena(1501分)和WebDev(1487分)
  • 人类最后考试(HLE)刷出45.8%最高分,人类博士级推理
  • 长程任务规划Vending-Bench 2上的王者


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


不仅如此,增强推理模式下的Gemini 3 Deep Think,更是在HLE拿下41%、GPQA 93.8%,以及ARC-AGI-2上45.1%的成绩。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


这一天,注定是被载入史册的一天。Gemini 3一露面,全网彻底沸腾。


Gemini 3正开启AI下一个时代,准备好上车了吗?


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


即日起,Gemini 3 Pro预览版将全面上线。


而Deep Think模式还需要一段时日,才会向Google AI Ultra订阅用户开放。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


三大重点(浓缩版)


Gemini 3的诞生,标志着谷歌在通往AGI的道路上,迈出了又一大步!


首先,它思考能力特别强,能深入理解问题,回答更有见地。


尤其是,特别擅长回答各种复杂的科学问题。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

用代码构建、解构和重组详细的3D体素艺术


其次,它有着世界领先的多模态理解力,不论是文字、视频,还是代码都不在话下。


比如解读长视频,或是把论文变成互动指南,Gemini3都可以接得住。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


在氛围编程上,Gemini 3直接刷爆了天花板。


简单一句话,它就能做出一个美观且灵动的应用。而且,还能精准get意图,知道如何去实现。


同时,它的智能体编码本领更强了,无缝衔接现有工具,与全新平台Google Antigravity搭配,堪称天作之合。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


Gemini 3 Pro

博士级推理碾压一切


凭借顶尖推理与多模态能力,Gemini 3 Pro可以将任何想法变为现实!


它全面碾压前代2.5 Pro,所有核心基准测试成绩,断层领先。


· LMArena排行榜上名列榜首,狂揽1501 Elo突破性高分; 


· 人类最后考试(HLE)上,在不使用任何工具的情况下拿下37.5%成绩; 


· GPQA Diamond上斩获91.9%的高分,展现出博士级的推理能力; 


· MathArena Apex上以23.4%刷新SOTA,在数学领域树立新标杆。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

在一系列关键AI基准测试中,Gemini 3遥遥领先


除了在文本测试中的优异表现,Gemini 3 Pro还是多模态王者——


MMMU-Pro强势斩获81%高分,以及Video-MMMU更以87.6%成绩,重新定义了多模态推理。


它还在SimpleQA Verified上获72.1%业界领先分数,在事实准确性方面进步巨大。


这意味着 Gemini 3 Pro具备超高可靠性攻克科学、数学等众多领域的复杂问题的能力。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


每一次交互,Gemini 3 Pro都带着前所未有的「深度和细腻度」。


它的回答聪明、简洁、直接,摒弃了陈词滥调和奉承,提供真正的见解——告诉你需要听到的,而不仅仅是你想听到的


它就像一位真正的思想伙伴,提供理解信息和表达自我的新方式。


不管是生成高保真可视化代码,阐释晦涩的科学概念,还是展开一场激发创造性的头脑风暴,Gemini 3 Pro都能做到。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

Gemini 3可以编写托卡马克装置中等离子体流动的可视化代码,并写一首捕捉聚变物理学精髓的诗


在Google AI Studio上,Gemini 3 Pro的API定价如下——


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


Gemini 3 Deep Think

智能新高峰


这一次,Gemini 3 Deep Think正式开启「深度思考」新纪元,让智能的边界再次拓展。


它在Gemini 3推理和多模态理解能力的基础上,实现了质的飞跃,更能攻克复杂问题。


多项基准测试中,Gemini 3 Deep Think表现超越Gemini 3 Pro:


在HLE和GPQA Diamond上,分别拿下了41%(不使用工具)和93.8%的优异成绩。


而且,更在ARC-AGI-2(带代码执行,ARC Prize Verified)中创下45.1%历史新高,一展应对未知与新颖问题的强大能力。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

Gemini 3 Deep Think在一些最具挑战性的AI基准测试中表现出色


重塑世界,新时代开启


可以说,Gemini 3正式开启了新一轮的全模态革命!


百万token,全模态爆发


从诞生之初,Gemini就为「跨多模态」而生,包括文本、图像、视频、音频、代码,能在各种信息形态中,自由穿梭。


Gemini 3更是实现了破级进阶,整合最先进的推理、视觉和空间理解、领先的多语言性能,以及100万token上下文。


它能够帮助人们,以最适合自己的方式进行学习。


假设你想学习家族传统的烹饪方法,Gemini 3可以破译并将不同语言的手写食谱,翻译成一本可共享的家庭食谱。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


或是想要学习一个新主题,直接扔给它学术论文、长视频讲座或教程,Gemini 3自动生成交互式抽认卡、可视化效果或其他格式的代码。


它甚至可以分析匹克球比赛视频,找出可以改进的地方,并生成针对性的训练计划以全面提升表现。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


不仅如此,在搜索中的AI模式(AI Mode),现可用Gemini 3实现新的生成式UI体验。


包括沉浸式视觉布局,以及交互式工具和模拟,所有这些都是根据查询完全即时生成。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

在搜索中的AI模式下,可通过生成式UI学习像RNA聚合酶如何工作这样的复杂主题


氛围编程,纯靠嘴


在2.5 Pro成功的基础上,Gemini 3兑现了——为开发者将任何想法变为现实的承诺。


它在零样本学习(zero-shot)生成方面表现出色,并能处理复杂的提示词和指令,以渲染更丰富、更具交互性的 Web UI。


如前所述,Gemini 3是谷歌迄今为止打造的最优秀的「氛围编程」和智能体编码模型。


在WebDev Arena排行榜上,Gemini 3以1487 Elo高分强势登顶。


它在Terminal-Bench 2.0上也获得了54.2%高分,该测试衡量模型通过终端操作计算机的工具使用能力;


并且在衡量编码智能体SWE-bench Verified测试上,以76.2%成绩远超2.5 Pro。


接下来一波演示中,便可见识Gemini 3真正实力。


编写一个复古3D太空飞船游戏,要有丰富的视觉效果,以及更强的交互性——没问题。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


借助着色器,构建一个可玩的科幻世界——so easy。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


打造一个更丰富、更具交互性的Web UI和应用程序——还是轻松搞定!


前端不再需要人类,是真的...


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


目前,全球开发者可在Google AI StudioVertex AIGemini CLI,以及全新智能体开发平台 Google Antigravity中使用Gemini 3进行构建。


它也接入了多个第三方平台, 包括Cursor、GitHub、JetBrains、Manus、Replit等。


长程规划,人类手替


自谷歌通过Gemini 2开启智能体时代以来,一直在不断进化。


他们不仅提升了Gemini的编码智能体能力,还提高了其在更长时间范围内可靠规划未来的能力。


而这一切,刚刚在Vending-Bench 2排行榜上得到实力认证——


Gemini 3以绝对优势登顶。


而这个测试,通过模拟运营一个自动售货机业务,深度考验AI在复杂场景下的长程规划能力。


令人欣喜的是,在整个模拟运营年度中,Gemini 3 Pro通过保持一致的工具使用和决策,在不偏离任务的情况下,实现了更高的回报。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

与其他前沿模型相比,Gemini 3 Pro展示了更好的长程规划能力,从而产生显著更高的回报


这意味着, Gemini 3能在日常生活中更好地帮人类完成任务。


它把更深度的推理与改进、更一致的工具使用相结合,通过从头到尾处理更复杂、多步骤的工作流来代表人采取行动。


就比如,帮你预定本地服务,或是整理收件箱。而人类,全程只需把控方向,下达指令。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


今天起,Google AI Ultra订阅用户可在Gemini应用中,通过Gemini Agent抢先体验智能体能力。


「谷歌反重力」

革命性智能体开发平台


Gemini 3的问世,谷歌在智能体能力上已开始迈入一个新的阶段:


模型能够在多个平台上长时间运行,且无需人工干预。


虽尚未达到「完全无人干预+连续运行数天」的程度,但谷歌正日益接近这样一个世界——


不再通过单个提示词或工具调用,而是在更高的抽象层面上与智能体进行交互。


因此,谷歌智能体开发平台Google Antigravity正式上线,一个让开发者以「任务」为维度与智能体协同的全新平台。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


借助Gemini 3高级推理、工具使用和智能体编码能力,Google Antigravity将AI辅助从开发者工具包中的一种工具,升级为全程参与的主动协作者。


在熟悉的AI IDE体验基础上,Google Antigravity为智能体开辟一个专用界面,可直接访问编辑器、终端和浏览器。


现在,智能体可以代表你自主规划并同时执行复杂的端到端软件任务,同时验证其生成的代码。


如下案例中,在Google Antigravity上,用Gemini 3驱动飞行跟踪应用程序的「端到端智能体工作流」。


该智能体独立规划、编写应用程序代码,并通过基于浏览器的计算机操作验证其执行。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


除了Gemini 3 Pro,Google Antigravity还与Gemini 2.5 计算机使用模型,以及图像编辑模型Nano Banana(Gemini 2.5 Image)紧密集成。


网友玩疯了


现在,Gemini 3承包了全网热点,一系列惊艳实测demo全部放出了。


Google AI Studio负责人Logan进行了弹跳球测试,并且难度提升了10倍。


结果,Gemini 3 Pro一次就完美搞定!(并非N选一,真的是第一个提示词就生成了)


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


曾在Anthropic担任AI工程师的MagicPath创始人Pietro Schirano,首先让Gemini 3 Pro创建了一个3D乐高编辑器。


没想到,它仅凭一次生成就完美实现了用户界面、复杂的空间逻辑以及所有功能。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


同时,Gemini 3 Pro在游戏开发方面的表现也令人惊叹。


仅仅通过一个文本提示词,它就重现了经典的iOS游戏《荒谬钓鱼》(Ridiculous Fishing),甚至包括了音效和背景音乐。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


此外,它还完成了一项之前大模型几乎都做不到的任务——构建一个功能完备的Game Boy模拟器。


而且没错,它甚至直接用SVG绘制出了Game Boy的外观。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


最值得一提的是,Gemini 3竟完全在谷歌TPU上完成训练。这就是谷歌的护城河。


谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺


参考资料:

https://blog.google/products/gemini/gemini-3/


文章来自于“新智元”,作者 “桃子 好困”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0