AI资讯新闻榜单内容搜索-GUI

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: GUI

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

最近，来自上海创智学院、复旦大学等机构的研究者提出了 Hallo-Live，试图正面解决这个矛盾。论文于 2026 年 4 月 26 日发布在 arXiv。该方法将异步双流扩散（Asynchronous Dual-Stream Diffusion）与人类偏好引导蒸馏（Human-Centric Preference-Guided DMD）结合起来

来自主题: AI技术研报

8266 点击 2026-05-24 10:20

无需构造偏好对：TGO用标量反馈对齐视觉生成模型｜ICML'26

无需构造偏好对：TGO用标量反馈对齐视觉生成模型｜ICML'26

无需构造偏好对：TGO用标量反馈对齐视觉生成模型｜ICML'26

生成模型的偏好对齐，可能正在进入一个新的阶段。

来自主题: AI技术研报

10387 点击 2026-05-18 09:54

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

近日，字节跳动智能创作部门（Intelligent Creation Lab）提出新作 DreamLite，一个主干网络仅有 0.39B 参数的轻量级统一扩散模型，在单一网络内同时支持文生图（Text-to-Image）和图像编辑（Text-guided Image Editing）两个任务，是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报

8950 点击 2026-05-13 10:30

压进我十年设计经验的 PPT Skills，迎来大波更新

压进我十年设计经验的 PPT Skills，迎来大波更新

压进我十年设计经验的 PPT Skills，迎来大波更新

上次开源 guizang-ppt-skill（github.com/op7418/guizang-ppt-skill）之后，大家都非常喜欢，短短几周 Github Star 来到了 6000 多。

来自主题: AI技术研报

10648 点击 2026-05-11 09:35

GitHub前创始人拿了a16z的1700万美元，GitButler要做Agent时代的Git

GitHub前创始人拿了a16z的1700万美元，GitButler要做Agent时代的Git

GitHub前创始人拿了a16z的1700万美元，GitButler要做Agent时代的Git

GitButler最近发布的CLI工具引起了我很大的兴趣。这不是一个简单的Git包装器，而是从根本上重新思考了命令行工具应该如何设计。Scott提到了一个有趣的观察：大约80%的开发者仍然使用命令行工具来操作Git，即使有各种GUI工具存在。

来自主题: AI资讯

8239 点击 2026-04-20 09:39

教龙虾玩手机！打通GUI智能体训练-评测-部署全流程，训练、真机、评测一站解决

教龙虾玩手机！打通GUI智能体训练-评测-部署全流程，训练、真机、评测一站解决

教龙虾玩手机！打通GUI智能体训练-评测-部署全流程，训练、真机、评测一站解决

今天，来自ZJU-REAL的团队带来了ClawGUI，一个覆盖GUI智能体在线RL训练、标准化评测、真机部署完整生命周期的开源框架。不是三个独立工具的简单拼接，而是一条打通的流水线：用ClawGUI-RL训练，用ClawGUI-Eval评测，用OpenClaw-GUI部署，端到端验证。

来自主题: AI技术研报

8178 点击 2026-04-19 13:33

「龙虾」从屏幕里爬出来了！现场复刻老板发言，连语调都一模一样

「龙虾」从屏幕里爬出来了！现场复刻老板发言，连语调都一模一样

「龙虾」从屏幕里爬出来了！现场复刻老板发言，连语调都一模一样

40克AI眼镜变身Agent之眼，数字分身定制分身。当Agent爬出屏幕走进物理世界，这场关于生产力的降维打击，真的不只是说说而已。

来自主题: AI资讯

7661 点击 2026-04-16 12:29

全球第一，13个SOTA！我们找到了龙虾界掌管GUI的神

全球第一，13个SOTA！我们找到了龙虾界掌管GUI的神

全球第一，13个SOTA！我们找到了龙虾界掌管GUI的神

有没有想过让「龙虾」替你打麻将？

来自主题: AI技术研报

6990 点击 2026-04-13 15:02

CVPR2026 | 鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

如果把手机屏幕想象成一个舞台，GUI 智能体就是台下那个 “被授权动手” 的人：它能看懂屏幕上的按钮、输入框和弹窗，能按你的指令去点、去滑、去输入。

来自主题: AI技术研报

10619 点击 2026-04-07 14:28

「Context 才是新操作系统」：从大疆、云鲸离开后，他要做 Agent Computer

「Context 才是新操作系统」：从大疆、云鲸离开后，他要做 Agent Computer

「Context 才是新操作系统」：从大疆、云鲸离开后，他要做 Agent Computer

「龙虾」（OpenClaw）的爆发，让一个趋势迅速达成共识——Agent 正在「杀死」软件，GUI 正在过时。而当下的电脑、手机等设备，并不是运行「龙虾」的最佳选项。

来自主题: AI资讯

8197 点击 2026-03-27 23:34

上一页当前第2页,共13页下一页