AI原生公司长啥样?他们造了个Agent,也造了一种新公司
AI原生公司长啥样?他们造了个Agent,也造了一种新公司5周内,他们如何做出了一个新的Agent产品,并完成了组织改造?那时,他们的公司火星电波成立了1年2个月,刚刚拿到新一笔200万美元融资。ListenHub——他们打造的一款AI驱动的音频内容生成工具,已经做到300万美元ARR,并实现了月度盈亏平衡。且,ListenHub仍在增长。按照原来的计划,他们会继续把它推向海外,到年底,营收或许还能再翻几倍。
搜索
5周内,他们如何做出了一个新的Agent产品,并完成了组织改造?那时,他们的公司火星电波成立了1年2个月,刚刚拿到新一笔200万美元融资。ListenHub——他们打造的一款AI驱动的音频内容生成工具,已经做到300万美元ARR,并实现了月度盈亏平衡。且,ListenHub仍在增长。按照原来的计划,他们会继续把它推向海外,到年底,营收或许还能再翻几倍。
你敢信?仅仅是让Fable 5数一下,单词raspberry里到底有几个字母r,结果就被一脚踢回了Opus 4.8!更离谱的还在后面。哈佛生物统计学家Kareem Carr,只是自报了一下家门——我是做生物统计的。话音刚落,Fable 5当场翻脸,直接强制降级。
还在用 DragGAN、DragDiffusion 拖拽修图?点选拖拽容易变形、边界割裂、细节丢失的时代落幕了!ECCV 2026 ICRDrag 首创上下文区域拖拽模型,用掩码精准定位局部区域,移动、缩放、变形全都丝滑自然,兼顾精准度与画面真实感。
本次访谈于2026年彭博科技大会举办,博通CEO陈福阳是业内知名的半导体并购大佬,正带领博通发力AI芯片赛道;采访者TomGiles为彭博资深科技记者,访谈恰逢博通财报发布后市场担忧其AI业务增长,他借此详解公司AI布局与发展预期。
近日,上海AI Lab等团队提出了一种面向专业软件智能体的新范式——ComAct(COM-as-Action)。它的核心思想在于:不再把鼠标点击和键盘输入作为Agent的action,而是让Agent直接生成COM代码,通过软件底层对象模型操纵真实专业软件。
vLLM 社区推出的 Semantic Router 除了专注上面三个方向,正在更进一步:我们认为:router 不只是选择模型,还可以提升模型能力。用户不用改权重,也不用让每个 Agent 团队都自己搭一套 Graph,而是在一次普通 Model API 调用的内部,组织出一支有边界、有预算、有验证、有回退的 “小队”。
今天来好好盘点 2026 年上半年的图片与视频模型,伴随模型更新时间轴出现的,还有我一些当时的测试文章。也算是对不怎么努力也没什么收获的上半年做个总结汇报了。
浙江大学等五所高校的研究团队提出 EgoTSR。研究从第一人称机器人视角出发,希望让 VLM 学会判断任务状态,并把这种能力进一步扩展到长程规划。团队构建了包含 4600 万条样本的 EgoTSR-Data,并设计了三阶段课程学习流程。
AI 创业公司「MobAI」已完成数百万元天使轮融资,由港股上市公司赤子城科技独家投资。目前,由MobAI开发的AI互动叙事应用Lunaverse Stories 已进入邀请制测试阶段。 熟悉AI互动类产品的人应该对MobAI并不陌生。
7月4日,豆包和通义千问宣布智能体功能将下线。豆包发布《豆包智能体功能下线通知》,称由于产品功能调整,智能体功能将于2026年7月15日下线。功能下线后,用户仍可在一段时间内查看并自行保存智能体信息及历史对话数据,10月15日后,豆包将根据《隐私政策》对智能体相关数据进行处理,后续将无法在豆包内查看或恢复。