AI资讯新闻榜单内容搜索-GE

任务级奖励提升App Agent思考力，淘天提出Mobile-R1，3B模型可超32B

现有Mobile/APP Agent的工作可以适应实时环境，并执行动作，但由于它们大部分都仅依赖于动作级奖励（SFT或RL）。

来自主题: AI技术研报

11892 点击 2025-07-21 12:25

Kimi K2模型API性能优化进行时：月之暗面积极应对高负载挑战

近日，月之暗面(Moonshot AI)正式发布了其万亿参数开源大模型Kimi K2，这一具有里程碑意义的AI模型凭借其创新的MoE架构和强大的Agentic能力迅速获得全球开发者关注。然而，随着用户量激增，部分开发者开始反映其API服务响应速度不尽如人意。面对这一情况，月之暗面于7月15日迅速作出官方回应，坦诚当前服务延迟问题，并详细说明了优化方案。

来自主题: AI资讯

10200 点击 2025-07-21 12:18

Kimi又火了，深度体验它的第一个Agent 后，我发现99%的AI产品忽略了这件「小事」

Kimi 又火了，在 DeepSeek 的热闹中沉寂大半年后，Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中，夺过了全球开源第一的宝座。

来自主题: AI资讯

9981 点击 2025-07-21 12:05

用完这个Agent，你会觉得ChatGPT Agent真的是个傻子。

上周五，ChatGPT Agent mode上线了。

来自主题: AI资讯

10633 点击 2025-07-21 11:27

星流/美图/Manus...6大主流视频Agent横测，我们在1句成片这条路上走了多远？

最近测Agent测的非常上头，而且越来越发现AI在各种专门的领域的垂直能力发展的越来越好了。

来自主题: AI产品测评

10590 点击 2025-07-21 10:40

ChatGPT Agent遭暴击，国产AI轮番“公开处刑”

OpenAI推出ChatGPT agent引发国产Agent竞品（如Manus、Genspark）公开对比，声称自身更优。实测退休计划任务显示，ChatGPT输出简陋，仅20分钟完成简易PPT；而Kimi报告详尽并互动提问，Minimax多格式输出，Manus快速设计美观。ChatGPT仅功能整合，非革命性升级，但标志AI从问答向任务执行协作转型。

来自主题: AI资讯

9135 点击 2025-07-20 12:52