
500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式
500万TPM+20msTPOT,火山引擎用「AI云原生」重构大模型部署范式部署 DeepSeek 系列模型,尤其是推理模型 DeepSeek-R1,已经成为一股不可忽视的潮流。
部署 DeepSeek 系列模型,尤其是推理模型 DeepSeek-R1,已经成为一股不可忽视的潮流。
我叫海玮,喜欢做有趣的产品。 前创业者:大学创办过年流水200w的公司。曾拿过种子轮投资、天使轮投资意向。目前正在做的产品是魂旅:魂旅是一款ai云旅游电台app,是提供给那些当下不方便旅游,但是又憧憬远方和自由的用户,做到肉体在上班,灵魂仍可出游万里的效果。
谁也没想到,去年还接近被放弃边缘的港股,竟然在2025年以这种火爆的方式回归。
本周一,阿里巴巴集团CEO吴泳铭抛出了炸弹——未来三年将投入超3800亿元建设云和AI硬件基础设施。这个金额,不仅创下了中国民营企业在该领域有史以来最大规模的投资纪录,更像一枚投入湖面的巨石,在中国科技产业激起层层涟漪。
美国AI云服务商Together AI宣布完成3.05亿美元B轮融资,估值高达33亿美元!该公司押注开源模型,提供包括DeepSeek-R1在内的200多个模型API服务,并出租GPU算力,年收入已超1亿美元。
在AI计算资源日益稀缺的时代,Lambda凭借其独特的云GPU解决方案迅速崛起,成为资本市场的宠儿。最近,这家成立于2012年的AI云计算公司宣布完成4.8亿美元D轮融资,累计融资额达到8.63亿美元,跻身AI创投榜云科技赛道第二位,仅次于Coreweave。此次投资阵容强大,包括英伟达、AI技术大牛Andrej Karpathy,以及和硕、超微、纬创、纬颖等行业巨头的战略入股。
DeepSeek 最近的爆火程度令人咋舌。短短20天内用户量就突破3000万,导致官方服务器几乎天天处于过载状态。虽然市面上已经涌现出不少第三方接入平台,但这些平台大多针对个人用户,对开发者和企业的需求难以满足。
2月1日,就在OpenAI上新o3-mini推理模型同时,DeepSeek深度思考和联网搜索功能被爆暂时停止服务。一天之后,经字母榜实测,目前DeepSeek深度思考服务已恢复正常,但联网搜索仍提示“由于技术原因,暂不可用”。
CoreWeave从最初的加密货币挖矿业务起家,现已成为AI云计算领域的领军企业。
Sealos让应用可以在云操作系统中以智能的方式快速诞生。