为什么AI浏览器可以聚集一切

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
为什么AI浏览器可以聚集一切
8059点击    2025-07-02 11:08

为什么AI浏览器可以聚集一切


当人们进入互联网时代时,围绕信息的生产、分享与消费的需求,走出了一条网页-浏览器-门户-搜索-社交网络的相对线性的发展路径。站在这条路径基础上,人们在拥抱AI时代的过程中,不同的企业和开发者以此为参照,同时在不同节点寻找着AI化的可能性。


其中,浏览器是互联网时代的第一个全民级应用。比尔·盖茨在三十年前发布的著名备忘录《互联网浪潮》中写道:我们相信,在未来 20 年,计算机将对工作、学习和游戏产生根本性的影响。出色的软件产品对于实现这些进步至关重要。微软由此开始争夺浏览器这个作为入口的软件。


AI浪潮中,AI浏览器成为AI应用中竞争最为激烈的节点之一。AI浏览器的竞争参与者众多,从明星创业者到互联网元老,从国内巨头到海外新秀,都纷纷投身其中。Fellou、Dia、Opera都在寻找原生AI浏览器的最佳实现路径,Chrome、QQ浏览器中也都置入了AI助手能力,OpenAI和Perplexity也都要发布自己的浏览器产品。


入口是浏览器给到人们的最直接诱惑。每一次主流浏览器的更迭,都是一次入口的易手。微软与网景围绕浏览器展开了互联网时代的第一次平台之争,微软的胜出使其通过Windows+IE的组合,进一步强化了在桌面端的统治地位。当Google推出Chrome,将躺在功劳簿上的IE浏览器掀翻在地,也顺势为搜索找到了最契合自己的搭档。



为什么AI浏览器可以聚集一切


当人们意识到AI可能会带来新的颠覆时,浏览器依旧是组成AI体验的核心部件之一。只不过,AI浏览器从搜索的容器变成了AI能力的躯体,从信息获取的窗口变成了代理执行的伙伴。这个变化背后,AI正在将搜索、决策、执行融为一体,让人们可以通过自然语言来操作完成更为复杂的操作。


这也让AI浏览器成为一个重叠点,AI搜索、通用Agent、copilot等不同方向的AI应用会在这里找到交集。作为AI助理的豆包、AI搜索产品夸克、知识库产品ima都选择以浏览器的形态来承载自己的产品能力。同时,扣子空间、Manus为AI配置的虚拟电脑,也更像是一个基于浏览器能力实现的Web端工具合集。


这个趋势下,AI浏览器会变得更像一个面向AI时代的操作系统。这是Google曾期待Chrome实现的目标——绕开传统桌面系统,以浏览器为核心,利用云端能力构建起新的软硬件生态


当AI用一个框和一个浏览器界面就能完成大部分复杂任务时,也意味着桌面只剩下唯一的任务,就是支持人们打开AI浏览器。


在AI浏览器身上,我们看到了一个人与世界的、更简单的未来交互范式。这个交互范式不但会改变软件,也会让硬件成为AI的本地算力提供者和云端算力连接者,打造出更灵活、轻量化的软硬件生态。前者可以充分利用电脑硬件配置,在浏览器上支持AI运行复杂任务,后者则可以在智能眼镜等轻量化设备上执行简单任务。


AI驱动的浏览器改造



网景公司创始人Marc Andreessen曾说,浏览器是有史以来对人们生活影响最大的一个软件。这个判断在今天也没有发生变化。即便是在移动互联网如此普及,人们习惯了在微信、抖音上搜索和浏览信息的今天,浏览器依然在全球拥有数亿用户,承担着很大一部分复杂的信息获取工作,并且是共享文档、多维表格的主要打开方式。


当AI成为新一轮科技浪潮的驱动核心,浏览器也成为了AI能力的关键载体。已经发布的诸多AI浏览器产品,都在依托更智能的搜索体验和更复杂的任务智能能力,收获到关注和追捧,一次次创造出“一码难求”的景象。截止目前,如果你想注册和使用Fellou、Dia这样的AI原生浏览器,依然需要先去求一个邀请码。


AI驱动的前提下,不同的AI浏览器虽然都遵循了AI对话框+浏览器界面的设计,但在具体的使用上会有不同的侧重。各自不同的立场和出发点,决定了产品的开发逻辑与使用体验。


我们大体可以将AI浏览器划分为三类:AI原生浏览器、类AI浏览器和AI化的传统浏览器


在AI原生浏览器产品中,Dia会让我觉得更像是在使用一个浏览器,操作更为简便流畅。在它的搜索框中填入内容后,用户可以自主选择搜索打开网页或是开启聊天对话。在已经打开的页面中,用户也可以随时开启AI对话,对一个或多个页面进行总结提问,其工作流是先满足信息获取需要,然后才进一步过渡到写文章或代码编写。



为什么AI浏览器可以聚集一切



相较而言,Fellou给我的感觉会更像是一个采用了浏览器形态的Manus,功能更复杂。因为它对代理式深度行动和代理式浏览器的强调,我在使用它时,第一时间就会生出一种为助手们下达任务的心态。在下达任务之后,等待着助手去完成任务。这种使用体感与Manus、扣子空间的完全一致,不会有太强的浏览的使用感受。



为什么AI浏览器可以聚集一切



AI原生浏览器产品之外,豆包、夸克、ima的桌面版也都是以浏览器的形态存在,但又不会在产品定位中突出浏览器的定位。对于这些主打AI助手、AI搜索、AI知识库的产品而言,浏览器更像是一个附赠给用户的产品功能,让用户能在其中打开任务页面,其产品升级也依然会围绕AI对助手、搜索、知识库的优化来进行。


此外,传统浏览器也在抓住AI带来的机会,实现老树发新芽的目标。QQ浏览器上线了QBot,支持多模态搜索、自动识别页面浏览意图、辅助办公能力的调用等。Chrome在更新中,也集成了Gemini AI助手,微软为Edge浏览器上线了AI助手Copilot Vision。这种变化实际上是为浏览器增加了一个AI插件,使其在原有体验之外具备了更多AI能力。


相较AI原生浏览器和类AI浏览器产品,传统浏览器在进行AI化时会有更多包袱,难以将一个老产品快速切换到新赛道。因此,往往会选择渐进式地改造思路。QBot产品负责人刘汉博表示,QQ浏览器会在保留原有优质业务内容的基础上,通过AI实现增量提升。AI也确实带来了一定的增量。在QQ浏览器AI功能正式发布前的灰度测试阶段,被覆盖的用户活跃度变高,整个大盘在往上走。


浏览器的竞争逻辑:入口、操作员和智能伙伴


尽管三类产品的实现思路有所差异,但其背后的竞争逻辑是相同的。


首先,围绕AI浏览器的竞争,就是在争夺新一轮的入口掌控权,这已经是一个共识。Dia的开发商The Browser Company的CEO Josh Miller在一封公开信中表示,云端营收暴涨,新兴创业公司都以浏览器为平台,加密货币生态依赖浏览器插件,WebAssembly开启全新交互体验……


一切都在往浏览器里聚集。


这个聚集的趋势在AI的刺激下变得更明显了。人们开始越来越多地依赖Web端实现AI搜索、AI生图、AI生成视频等需求。同时,我们也能看到AI社交产品在2025年第一季度在Web端有明显增长;淘宝这样的电商平台也开始重新重视起PC端的体验;人们与扣子空间、Manus这类Agent产品的交互也更多集中在网页上。


同时,AI在改变人们在浏览器内的需求匹配模式。尽管现在还是依靠传统的页面来承载这些能力,但未来可能人们并不需要看到传统的页面。更多需求会在浏览器的地址栏中被提出,然后由AI去分配、执行,最后将结果反馈在地址栏延展出来的聊天界面中。这样的发展趋势下,浏览器的地址栏也会像夸克的搜索框一样,演变为超级框,成为AI的核心入口。


其次,大家争夺的不再只是信息获取的入口,还是自动化任务流的起点,浏览器在其中将扮演操作员的角色。


Perplexity的CEO Arvind Srinivas认为,Perplexity的产品要完成的是一系列的工作流,例如Perplexity的Agent能帮用户管理投资组合,读完报告和新闻后,它会告诉用户如何调整风险敞口。这个Agent要理解整个搜索和信息浏览的过程,而不仅是单次的词条搜索。



为什么AI浏览器可以聚集一切



浏览器是承载这个过程的合适载体。Arvind Srinivas表示,如果你真的希望AI从提供答案转变为采取行动、为你做事——答案本质上是四五个搜索的组合,而行动则是一个完整的浏览会话,通过一个提示完成——你需要有一个浏览器,并在客户端和服务器端无缝整合计算能力。


在Fellou创始人谢扬的介绍中,Fellou产品的前四大类使用场景分别是信息查询、数据爬取、社交媒体发文和自动填表,有60%的用例是在进行数据查询以及爬取。有人通过Fellou在领英上给他心仪的公司发送求职信息,最终收获了10家公司的面试邀请,并成功入职了其中一家公司。这可以说明,用户也确实期待AI浏览器具备更强的行动力。


需要注意的是,AI浏览器能够通过cookies获得更多用户的上下文信息,比如用户在网站上浏览了什么,做了什么,登陆了什么账号。同时,AI浏览器能够让用户在已登录状态下,通过隐藏标签页访问其他第三方服务,抓取页面数据,并能代表用户进行推理和执行操作。这可以解决AI应用没有底层控制权,不能直接调用其他应用并获取相关信息的问题。


最后,浏览器之争最终可能还是智能伙伴之争。


浏览器在未来会成为AI助手的一部分。谢扬认为,Fellou做的事是让更多人有自由;让更多人有时间;让更多人能够做自己。Josh Miller告诉《the Verge》,Dia的核心功能是一个聊天工具,帮助用户更清晰地、更轻松地查找信息、完成工作。


这些定位都指向了一种更具记忆力和执行力的智能伙伴。


Chrome OS故事的延续


从我自己的使用体验来看,现在的AI浏览器还不是一个称职的智能伙伴,更像是一个还没有学会使用工具和专业技能的孩童。


我们可以要求AI浏览器代替我们写邮件、发简历、写网页,但很多时候都仅能到达及格水平,甚至有些复杂任务会在执行过程中走向崩溃。例如,在使用Fellou制作当天的新闻信息简报时,它很难从新闻网站上获得足够有效的信息。


AI浏览器需要具备一个能力和工具生态。某种程度上,AI浏览器获取信息的主要方式不再是浏览网页,而是与不同应用、服务商直接进行数据或协议层面的沟通。Opera开发的AI浏览器Neon就没有采用浏览页面的方式获取信息,而是通过DOM树和排版资料分析网页内容,更快速获取到有效信息。


这个生态可能会分成两层。第一层是基于AI浏览器的能力,可以打造出一个全新的AI插件体系。Dia就在尝试建立这样一种技能生态,让用户能够利用Dia的“技能”功能编写代码,创建不同的任务、能力,并像App Store一样将其分发出去,成为一个匹配需求与能力的“路由系统”。



为什么AI浏览器可以聚集一切


第二层则是与第三方平台的打通。The Information在2024年11月的报道中表示,OpenAI也在打造一款AI浏览器产品,这个产品会与ChatGPT深度整合,并且将接入旅游、食品、房地产、零售等服务商的能力。联系到亚马逊正在尝试打造的购物Agent,我们会认为这种第三方能力的接入很大概率上会通过Agent之间的交互来实现


拥有应用生态的AI浏览器会更像一个操作系统。Josh Miller明确表示,Dia最终要打造的是一个基于浏览器的系统,并且这个系统在充满Agent的未来会成为一个强大的指挥中心。Arvind Srinivas也强调,浏览器本质上就是一个容器化的操作系统,是构建Agent的最佳途径。


这很像是Chrome OS故事的AI升级版。Google在2011年推出的Chrome OS承载了其基于Web应用和云服务开发操作系统的野心。此后,Google还推出了搭载 Chrome OS的Chromebook。


Chromebook不像上网本一样通过低配置搭载Windows系统,在本地实现轻度办公,而是调用云端资源与Google服务的结合,满足用户的日常使用需求。


最早的Chromebook被吐槽为“加了外壳的浏览器”。但随着Chrome OS的不断迭代,Chromebook在北美和欧洲的教育市场不断攻城略地,成为了350美元以下价位笔记本消费者的主要选项。以此为参照,如果AI浏览器真的成为了人们最主要的计算空间,AI浏览器也可能会拥有与其相匹配的硬件产品。


这个硬件可以是具备本地算力的PC或只依赖云端算力的智能眼镜。从无缝连接的需求上看,AI浏览器就是一个类似Chrome OS的轻量化AI操作系统,围绕AI打造出一个软硬件的新生态,让人们生活在AI互联网上。


文章来自公众号“窄播”,作者“李威

关键词: AI , AI浏览器 , AI入口 , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/