
Manus 背后的重要 Infra,E2B 如何给 AI Agents 配备“专属电脑”?
Manus 背后的重要 Infra,E2B 如何给 AI Agents 配备“专属电脑”?E2B 的愿景很大,CEO 的目标是成为 AI Agent 时代的 AWS,成为一个自动化的 infra 平台,未来可以提供 GPU 支持,满足更复杂的数据分析、小模型训练、游戏生成等需求,并可以托管 agent 构建的应用,覆盖 agent 从开发到部署的完整生命周期。
E2B 的愿景很大,CEO 的目标是成为 AI Agent 时代的 AWS,成为一个自动化的 infra 平台,未来可以提供 GPU 支持,满足更复杂的数据分析、小模型训练、游戏生成等需求,并可以托管 agent 构建的应用,覆盖 agent 从开发到部署的完整生命周期。
刚刚,外媒爆料:2个月内,英伟达的中国特供版H20就要来了!不过,这次为了满足新的出口管制,H20在阉割版的基础上又继续做了阉割。H20订单已经爆了,总额达180亿!
游戏在20 世纪 90 年代推动了 GPU 处理器的诞生,因此,如今由 GPU 驱动的人工智能技术渗透进视频游戏设计的几乎每个环节,可谓恰逢其时。顺应这一趋势,一家名为 Sett 的初创公司于周三宣布结束隐匿模式,获得 2700 万美元融资,该公司致力于开发用于构建和运营移动游戏的 AI Agent。
现在,跑准万亿参数的大模型,可以彻底跟英伟达Say Goodbye了。
科技巨头常吹嘘需要庞大昂贵GPU 集群的万亿参数 AI 模型,但 Fastino 正采取截然不同的策略
官宣!英伟达RTX 5060显卡发售时间定了。
AI超算性能、电力、成本激增,美国主导。
近日,美国 AI 初创公司 Anthropic(Claude 背后公司)就美国商务部的《人工智能扩散框架》临时最终规则提交意见书,呼吁加强对高端AI 芯片的出口控制。更具争议性的是,Anthropic 在博客中声称,中国已建立起高度成熟的芯片走私网络,涉及金额高达数亿美元。
多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推理效率的降低。
LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。