BrowserBC:克隆人类点击,让一次网页操作转化为所有Agent的能力
BrowserBC:克隆人类点击,让一次网页操作转化为所有Agent的能力Agent从来不是不会用浏览器,只是浪费太多时间在探索——BrowserBC把人类轨迹蒸馏成可复用Skill来完成Behavior Cloning,用户点一遍,Agent照着就能跑通。Einsia AI旗下Navers Lab发布的开源项目BrowserBC给出的答案,是一条三步范式:录制→转写成Skill→交付执行。
搜索
Agent从来不是不会用浏览器,只是浪费太多时间在探索——BrowserBC把人类轨迹蒸馏成可复用Skill来完成Behavior Cloning,用户点一遍,Agent照着就能跑通。Einsia AI旗下Navers Lab发布的开源项目BrowserBC给出的答案,是一条三步范式:录制→转写成Skill→交付执行。
有网友发梗图表示震惊,怎么会有用户一天能运行 Agent 71 个小时。也就是说,在 OpenAI 内部,工作场景里的 AI 使用,几乎已经切到了 Codex 上。Codex 这份报告将衡量 AI 应用深度的指标,定位在我们交出去的任务有多重、agent 替人类跑了多久、用户是不是在同时盯着好几条工作线。
阿里云正式宣布,Apache Flink 3.0全面进入Agentic Streaming For AI时代,并推出全模态数据流处理能力。这是业界第一次,把视频、音频、图像、文本这四类数据,统一放进同一条流式pipeline里调度,让AI能够实时感知、实时理解、实时回应。
来自至知创新研究院(IQuest Research)、中国人民大学高瓴人工智能学院、KAUST等机构的研究团队提出了FORT,一个面向Deep Search Agent的shortcut-resistant training-data synthesis framework。
当全球具身智能行业还在争论技术路线时,一家中国公司已经率先定义并跑通了自己的答案。深度机智提出的「人类学习」路线——以人类数据为起点、动作建模为中心、机器人为 AI 而生——正在被英伟达、Physical Intelligence 等海外头部机构沿同一方向跟进。
太酷了,这个 Agent 的体验。感觉这是最近除了 Codex 外,最让我惊喜的 Agent 产品了。今天想和大家分享一下。
我们获悉 前飞书产品VP施凯文联同上海交大AP张倬胜开启Agent创业。多位知情人士透露(综合):其创业公司名为界面之上,偏交互侧创新;也有人透露是个人助手OS方向,首轮获锦秋、红杉等机构投资,估值高达5亿美元
非手机业务目标400亿美元,“飞龙”进入数据中心,高通这次整了个大的。
过去十年,推荐系统最核心的动作可以概括成一个字:找。
每个人都在谈Agent,每个论坛都在喊"下一个风口",市场分析机构已经把2030年的市场规模标到了500亿美元。但你真去翻翻那些号称"做Agent"的公司,大多数不过是在ChatGPT外面套了一层壳,多填了几个Prompt,搭了个还算能看的界面,就敢出来融资了。