
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA
月之暗面「调教」出最强Agent,在「人类最后一场考试」拿下最新 SOTA这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
这款 Agent 擅长多轮搜索和推理,平均每项任务执行 23 个推理步骤,访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建,并完全通过端到端智能体强化学习进行训练,也是国内少有的基于自研模型打造的 Agent。
前有美图的出海,验证了“颜值经济”的普适性,也悄然改变着大众对于修图工具类产品的消费认知。
嘿,大家好!这里是一个专注于前沿AI和智能体的频道~
最近,一类「穿越 vlog」爆火了。有人让 Veo 3 变成「时间机器」,将人们带回历史事件中进行现场直播。
只需修改两行代码,RAG向量检索效率暴涨30%!
你有没有想过,为什么互联网时代的工作还是这么繁琐?为什么我们还在重复填写表格、点击按钮、手动查找信息?当 AI 能够写代码、画图、甚至思考复杂问题时,为什么我们仍然被困在一个个网页界面中,像机器人一样执行着重复性任务?
微软 2025Build 大会开源了一个名为 NLWeb 的项目。它能做到仅仅用300行代码,就在你现有的网站上加个 ChatGPT 聊天对话框。
近日,初创公司 Every 总经理 Kieran Klaassen 在 x 上表示自己用 Claude Code 编程时平均每天花 250 美元,也就是说一个月花费 6000 美元(约合 4.3 万人民币)。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。
2024年全球AI移动应用收入达12亿美元,同比猛增179%。图片/视频生成应用主要由亚洲市场驱动,细分需求兴起;ChatBot领域ChatGPT占据主导,但套壳产品表现意外强劲,用户分层明显(高知男性与年轻女性为主)。AI赋能生产力工具收入显著增长34.9%,但大厂优势依旧显著。