AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
谷歌超级编码智能体正式上岗!125刀大会员,每天300任务任意跑

谷歌超级编码智能体正式上岗!125刀大会员,每天300任务任意跑

谷歌超级编码智能体正式上岗!125刀大会员,每天300任务任意跑

8月6日,谷歌正式发布编程智能体Jules,摘掉了「测试版」标签。Jules具备异步执行能力,依托Gemini2.5Pro模型,可独立修复Bug、更新代码并深度集成GitHub,大幅提升开发效率。

来自主题: AI资讯
6464 点击    2025-08-15 11:43
2025 AI Agent 发展现状与六大趋势

2025 AI Agent 发展现状与六大趋势

2025 AI Agent 发展现状与六大趋势

近半年,Agentic AI 创新步伐明显加快。更强的自主决策、更丰富的多模态融合,以及与外部系统的深度协作,正推动产品加速落地与商业化。

来自主题: AI资讯
8679 点击    2025-08-15 11:15
实测商汤AI视频Agent Seko,一句话成片要塌房了

实测商汤AI视频Agent Seko,一句话成片要塌房了

实测商汤AI视频Agent Seko,一句话成片要塌房了

视频Agent生成过程中顶多也就是让我点点选项,或者直接针对某一处不满意的地方用对话形式修改,甚至可能我提了一个意见,直接整个片子都给我换了个不一样的。

来自主题: AI产品测评
8202 点击    2025-08-14 11:42
离谱,用上了一个非常逆天的Agent...

离谱,用上了一个非常逆天的Agent...

离谱,用上了一个非常逆天的Agent...

2025年被视为 AI Agent元年,各家科技巨头也纷纷出手,谁都不想错失这个火热的赛道。

来自主题: AI资讯
6125 点击    2025-08-14 09:51
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式

Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式

Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式

年初,DeepSeek 前脚带来模型在推理能力上的大幅提升,Manus 后脚就在全球范围内描绘了一幅通用 Agent 的蓝图。新的范本里,Agent 不再止步于答疑解惑的「镶边」角色,开始变得主动,拆解分析需求、调用工具、执行任务,最终解决问题……

来自主题: AI资讯
5921 点击    2025-08-14 09:40
港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体

刚刚,一篇来自香港大学 XLANG Lab 和月之暗面等多家机构的论文上线了 arXiv,其中提出了一个用于构建和扩展 CUA(使用计算机的智能体)的完全开源的框架。 使用该框架,他们还构建了一个旗舰模型 OpenCUA-32B,其在 OSWorld-Verified 上达到了 34.8% 的成功率,创下了新的开源 SOTA,甚至在这个基准测试中超越了 GPT-4o。

来自主题: AI技术研报
8256 点击    2025-08-14 09:39
AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

最近 AI 界的大新闻是 GPT-5 和谷歌的世界模型 Genie 3。然而,在无人在意的角落里,微软悄悄把 Edge 进化成了了 AI 浏览器。

来自主题: AI资讯
6071 点击    2025-08-13 17:12
研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

强化学习(RL)是锻造当今顶尖大模型(如 OpenAI o 系列、DeepSeek-R1、Gemini 2.5、Grok 4、GPT-5)推理能力与对齐的核心 “武器”,但它也像一把双刃剑,常常导致模型行为脆弱、风格突变,甚至出现 “欺骗性对齐”、“失控” 等危险倾向。

来自主题: AI技术研报
7188 点击    2025-08-13 16:29
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起,有望彻底改变人机交互的方式。然而,这一领域的进展正面临瓶颈:现有数据集大多聚焦于 10 步以内的短程交互,且仅验证最终结果,无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯
6734 点击    2025-08-13 16:17
新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

新加坡的Agent黑马Agnes,双杀技能:Deep Design × Wide Research重新定义智能体?

之前在X上看到过一个新加坡版的DeepSeek,叫Agnes AI,主打一站式Agent空间。 但当时我自己搞产品焦头烂额的,随手点开看了看,就放下了。 后来在Product Hunt上又看到这款产品,以及各种海外平台时而刷到。

来自主题: AI资讯
7232 点击    2025-08-13 12:32