文档秒变演讲视频还带配音!开源Agent商业报告/学术论文接近人类水平
文档秒变演讲视频还带配音!开源Agent商业报告/学术论文接近人类水平现在的AI Agent在文档生成PPT或视频方面,要想像人一样,把文字、图片、讲解、音视频全都串起来讲清楚,还真不太行。
现在的AI Agent在文档生成PPT或视频方面,要想像人一样,把文字、图片、讲解、音视频全都串起来讲清楚,还真不太行。
刚刚,全球首个通用生物医学AI智能体Biomni正式开源,相关代码及文件已经在Github发布,现已斩获超过700星,任何人都可以进行本地部署。
3月份,我在线下分享过办公软件的一个大趋势——未来,每个人的应用使用界面将只保留一个或极少数几个。现在,如果企业同时运行着20个软件,需要分别登录这20个应用进行相应的任务操作。而AI正在让使用界面和操作界面实现分离。以后,用户只需停留在一个高频应用界面,就能让Agent在背后完成绝大部分跨应用操作,人类只需等待执行结果。
距离 3 月凭借 “AI 智能体自主完成复杂任务” 的产品惊艳亮相仅四个月不到,AI Agent 公司 Manus 就因一场大规模裁员陷入舆论漩涡。近日, Manus 向多家媒体证实,公司对国内业务团队展开优化,120 名员工中,除 40 余名核心技术人员迁往新加坡总部,其余皆被裁员。
Listen Labs 由两位哈佛校友 Florian Juengermann 与 Alfred Wahlforss 在 2024 年底联合创立,并在 2025 年 4 月连获 Sequoia 领投的种子轮与 A 轮合计 2700 万美元融资,目标是打造一套能自动招募受访者、主持上千场多语访谈、即时归档并复用洞察的“AI 用户研究员”体系。
企业级Agent正在成为整个toB市场的共识。企业级智能体(toB AI Agent)正在成为全球最受资本追捧的赛道之一。
2025上半年AI Agent领域经历模型竞争加剧和范式演进,DeepSeek等新模型打破垄断,推动Tool Use和强化学习突破。Agent从Prompt、Workflow发展为自主决策、环境感知和工具使用的智能体。编程领域验证PMF,落地机会集中于垂直场景和C端创新,但商业壁垒和技术挑战仍待解决。
最近,BetterYeah AI 宣布完成了国内 AI Agent 赛道目前公开的规模最大的融资。
AI 助手,向着「低调实用」方向发展。几周前,我为了一份行业深度文章的撰写,在堆积如山的数据分析文件和浏览器标签页中挣扎了整整两天。
IT之家 7 月 8 日消息,针对近期流传的公司大规模裁员传闻,AI Agent(智能体)平台 Manus 方面向澎湃新闻记者回应称,“基于公司自身经营效率考量,我们决定对部分业务团队进行调整。公司将继续专注核心业务发展,提升整体运营效率。”