月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
来自主题: AI资讯
9107 点击 2025-06-21 19:42
搜索
这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。