
手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布
手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。
来自主题: AI技术研报
6643 点击 2025-07-27 13:01
多模态大模型 (MLLM) 驱动的 OS 智能体在单屏动作落实(如 ScreenSpot)、短链操作任务(如 AndroidControl)上展现出突出的表现,标志着端侧任务自动化的初步成熟。
科技圈再掀波澜,一家名为Graphite的纽约人工智能初创公司,正式名称为Screenplay Studios Inc.,今日宣布成功斩获高达5200万美元的B轮融资,为这家专注于颠覆传统代码审查模式的新星注入了强劲动力。
ScreenPipe!作为 Rewind.ai 的开源替代方案,它功能强大,使用灵活,支持中文 OCR,同时兼容 Ollama,让你轻松本地部署,一键回顾你的电脑世界。
面对各类流媒体、短视频平台的竞争,YouTube 一直在研究、模仿各种功能,试图让用户在 YouTube 上停留更多时间。
谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。
YouTube 今天宣布其短视频平台 Shorts 推出一项新功能,允许用户利用人工智能工具来创建视频。该功能名为“Dream Screen”,用户只需输入想要查看的内容即可创建人工智能生成的视频或图像背景。