一夜告别Token账单!端侧AGI真来了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一夜告别Token账单!端侧AGI真来了
7210点击    2026-05-21 10:13

Agent不再只住在云端——联想携手此芯科技,把190 TOPS本地AI算力装进手掌大小的AI主机,让每个人都能拥有一座7×24小时运行的私人Token工厂。 


忘掉那些动辄上万块的云端Token账单吧。


2026年,AI的战场已经彻底变了。


Agent已经杀进了你的手机、电脑、家里。帮你订机票、写周报、盯股票、管日程——7×24小时不休息,比任何助理都听话。


它们的每一次思考都在烧Token,每一个任务都在吞算力,云端的账单像水表一样跳个不停。


那么问题来了:谁来喂饱这些永远饥饿的Agent?


一场「超能之夜」

两台改写规则的AI主机


2026年5月19日晚,联想天禧AI一体多端全场景新品「超能之夜」在北京举办。


这场发布会最重磅的亮点,是全球首发两款基于此芯Agentic SoC P1打造的高性能智能体终端主机——联想AI主机P7联想AI主机mini


一夜告别Token账单!端侧AGI真来了


联想集团高级副总裁、中国消费业务群总经理张华在现场直言:「联想AI主机P7的主芯片,由中国著名芯片企业此芯科技特别定制。此芯P1高性能处理器,采用12核Arm架构,专为高效能AI计算设计。」


这句话的分量很重——一家PC巨头,把AI原生设备的「心脏」交给了一家成立仅四年多的国产芯片公司。


一夜告别Token账单!端侧AGI真来了


先看旗舰型号联想AI主机P7:机身只有手掌大小,整机功耗最大仅30W,一个普通移动电源就能带动。


但就是这么小的身板里,塞进了190 TOPS的本地AI算力,支持最高1220亿参数的本地大模型部署,顶配80GB内存128K上下文窗口,推理速度最高可达50 Token/s,运行噪音控制在35分贝以下。


一夜告别Token账单!端侧AGI真来了


更有意思的是「一机双模」设计。


模式一是智能体任务执行模式,预装天禧Claw,复杂任务最大化本地运行,不烧云端Token;模式二切换成私属大模型模式,提供API Key接口,任何AI应用都能接进来——秒变一座「本地免费Token工厂」。


放家里,它是全家共享的AI算力中心;揣进口袋,它就是你私人的口袋AI工作站。该机将于7月1日开启众筹,双11首批发货。


与P7一同亮相的联想AI主机mini,机身只有Mac Mini的一半大小,拥有45 TOPS本地算力,平均工作功耗仅15W,噪音低于30分贝。


同样预装天禧Claw,开箱即用,支持多成员数据隔离、记忆独立。更亲民的是价格:6月12日预售,首发优惠价2999元。


一夜告别Token账单!端侧AGI真来了


联想对这两款产品的定位很明确:行业首发个人家庭AI边缘设备,专为智能体而生的AI原生设备,7×24小时无休执行任务,让每个人、每个家庭都拥有私有的「Token工厂」。


一芯多态

构建全场景端侧AGI算力底座


支撑联想AI主机性能表现的核心,是此芯科技的Agentic SoC P1


这颗芯片采用6nm先进制程,单芯片综合算力达到45 TOPS。


在联想AI主机P7上,联想通过自研「天行AI计算架构」、dNPU/CPU/GPU异构算力调度,以及与此芯P1的深度软硬件协同优化,将整机本地AI算力提升至最高190 TOPS的惊人水平。


但此芯P1能做的远不止一台AI主机。


基于「一芯多态」的产品哲学,此芯科技已经用这颗SoC覆盖了端、边、云全形态产品方案,构建出完整的端侧AGI算力矩阵:


  • AGI迷你工作站——全球首款支持UEFI的Arm迷你工作站,可扩展独立显卡,本地流畅运行主流大语言、文生图及多模态模型;
  • AGI NAS——将传统NAS的存储能力与AI推理能力深度融合,打造个人与家庭的智能数字中枢;
  • AGI口袋实验室——掌上型高算力盒子,支持PCIe扩展AI加速卡,最高算力超过200 TOPS;
  • AGI PC——支持本地部署大语言模型与Agent框架,运行智能体应用和自动化工作流。


一颗芯片,驱动从口袋到桌面、从家庭到工作站的全场景AI计算——这就是「一芯多态」的核心逻辑。


以Agentic Compute赋能AGI时代


回头看此芯科技的路径,有一条清晰的主线:从芯片架构到产品形态,从模型适配到场景落地,完成了高性能Agentic Compute从「技术定义」到「实景落地」的完整闭环。


2021年成立,2024年发布P1芯片,联想创投天使轮入局,顺为资本、启明创投、蔚来资本等一线机构接力加注。


短短四年多,此芯科技已经从一家初创芯片公司,成长为端侧Agentic Compute赛道的关键玩家。


而此次联想AI主机的全球首发,则是对此芯科技技术实力的一次硬核背书。


当一颗国产SoC能够驱动1220亿参数大模型在掌上设备流畅推理,当30W功耗能撑起190 TOPS算力,「端侧AGI」就不再是一个营销概念,而是一个正在兑现的工程现实。


Agent时代的算力战争才刚刚打响。


云端Token的价格或许还会继续卷,但最终的胜负手,可能恰恰在你家客厅那台手掌大小的盒子里。


此芯科技正在用Agentic Compute这把钥匙,为每一个人打开AGI时代的大门。


文章来自于"新智元",作者 "新智元"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md