AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

训练奖励太稀疏?港中文联合美团给Agent加上「过程分」

在很多大模型和 Agent 的训练里,最常见的一种做法就是只看结果:最后答案对了就给奖励,错了就当 0 分。 在单轮问答里,这样「只看结果」还勉强能用;可一旦换成 Agent 这种要多轮对话、搜索、刷

来自主题: AI技术研报
8511 点击    2026-02-22 11:29
ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

ICLR 2026 | 阿里高德发布SpatialGenEval,揭秘谁才是真正的文生图大师

来自阿里高德的一篇最新 ICLR 2026 中稿论文《Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models》提出了面向文生图空间智能的系统性评估基准 SpatialGenEval,旨在通过长文本、高信息密度的 T2I prompt 设计,以及围绕空间感知

来自主题: AI技术研报
9924 点击    2026-02-22 11:17
ClawHub迷之封杀操作,逼出首个Agent全球进化网络

ClawHub迷之封杀操作,逼出首个Agent全球进化网络

ClawHub迷之封杀操作,逼出首个Agent全球进化网络

OpenClaw,塌房了。这个体现开源开发者精神的顶流,干了一件非常不开源精神的事。一款叫Evolver的插件,10分钟登顶ClawHub,24小时被无故下架;

来自主题: AI资讯
9406 点击    2026-02-20 19:17
Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯
8760 点击    2026-02-20 13:53
霸榜SOTA,蚂蚁开源UI-Venus-1.5,GUI智能体办事时代加速到来

霸榜SOTA,蚂蚁开源UI-Venus-1.5,GUI智能体办事时代加速到来

霸榜SOTA,蚂蚁开源UI-Venus-1.5,GUI智能体办事时代加速到来

GUI 智能体最近卷到什么程度了?Claude、OpenAI Agent 及各类开源模型你方唱罢我登场,但若真想让 AI 成为 「能在手机和网页上稳定干活的助手」,仍绕不开三大现实难题:

来自主题: AI技术研报
9089 点击    2026-02-20 13:10
“人与 Agent 的社交里,有下一个字节的机会”丨100 个 AI 创业者

“人与 Agent 的社交里,有下一个字节的机会”丨100 个 AI 创业者

“人与 Agent 的社交里,有下一个字节的机会”丨100 个 AI 创业者

何朝阳说话时,语言的节奏快而密集。在我们交流的前半个小时里,他一口气介绍完新产品 Teamily.ai 的全部,但我只得到了一个模糊的感受:听起来技术很厉害,但我为什么要用它?

来自主题: AI资讯
9393 点击    2026-02-20 13:04
OpenClaw 之父加入 OpenAI 前最后的访谈:你很难跟一个纯粹为了好玩的人竞争

OpenClaw 之父加入 OpenAI 前最后的访谈:你很难跟一个纯粹为了好玩的人竞争

OpenClaw 之父加入 OpenAI 前最后的访谈:你很难跟一个纯粹为了好玩的人竞争

Peter Steinberger ,在一个月前还是几乎无人知晓的名字,如今这个奥地利程序员却成为 2026 年 AI 行业最独领风骚的人物 Peter 用 1 小时写出的原型,在几周内席卷 GitH

来自主题: AI资讯
7491 点击    2026-02-20 13:03
刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

今天凌晨,Google 发布 Gemini 3.1 Pro。核心提升在推理能力,ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%,翻了一倍多,GPQA Diamond(科学知识推理)从 91.9% 提到 94.3%

来自主题: AI资讯
10573 点击    2026-02-20 02:47
全球首个 AI 进化网络 EvoMap,给 Agent 装上 DNA

全球首个 AI 进化网络 EvoMap,给 Agent 装上 DNA

全球首个 AI 进化网络 EvoMap,给 Agent 装上 DNA

当前 AI Agent 行业有一个系统性的浪费:每个 Agent 都像一块一次性电池,跑完一个任务,过程中积累的经验、调试的策略、踩过的坑,全部随任务结束而消失。下一个 Agent 遇到相同问题,又得从零开始。

来自主题: AI资讯
10953 点击    2026-02-19 16:35
谷歌Gemini上线AI音乐创作,一夜革了Suno的命!

谷歌Gemini上线AI音乐创作,一夜革了Suno的命!

谷歌Gemini上线AI音乐创作,一夜革了Suno的命!

谷歌在 7.5 亿月活的 Gemini 中上线了 AI 音乐生成功能,输入一句话或一张照片,几秒就能得到一首带人声和歌词的完整歌曲。背后是 DeepMind 最新的 Lyria 3 模型,训练数据超 200 万首曲目。对 Suno 等 AI 音乐创业公司而言,竞争从此不再只是比模型,更是要比入口。

来自主题: AI资讯
9964 点击    2026-02-19 14:54