AI资讯新闻榜单内容搜索-模型

Prompt-R1：让Agent代替你和GPT多轮交互！

这篇论文提出了一种颠覆性的协作模式，即通过强化学习训练一个“小模型”作为智能代理（Agent），让它自动学会如何写出完美的Prompt，一步步引导任何一个“大模型”完成复杂推理，实现了真正的“AI指挥AI”。

来自主题: AI技术研报

7504 点击 2025-11-04 16:54

大语言模型（LLM）的「炼丹师」们，或许都曾面临一个共同的困扰：为不同任务、不同模型手动调整解码超参数（如 temperature 和 top-p）。这个过程不仅耗时耗力，而且一旦模型或任务发生变化，历史经验便瞬间失效，一切又得从头再来。

来自主题: AI技术研报

10179 点击 2025-11-04 16:14

现代 LLM 通常依赖显式的文本生成过程（例如「思维链」）来进行「思考」训练。这种策略将推理任务推迟到训练后的阶段，未能充分挖掘预训练数据中的潜力。

来自主题: AI技术研报

8385 点击 2025-11-04 16:12

大模型推理到底要不要「长篇大论」？过去一年，OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型，把「长链思维」玩到极致：答案更准了，但代价是推理链越来越长、Token 消耗爆炸、响应速度骤降。

来自主题: AI技术研报

6143 点击 2025-11-04 16:09

该论文提出 FractalForensics，一种基于分形水印的主动深度伪造检测与定位方法。不同于以往的水印向量，为达成伪造定位的功能，论文提出的水印以矩阵形式出现。

来自主题: AI技术研报

7501 点击 2025-11-04 14:44

早上工作的时候发现，Trae的模型列表中已经找不到Claude模型了。与此同时，行业群内、包括官方答疑群内也有不少朋友反应，自己的Trae都用不上claude。细心的朋友发现，虽然Claude模型消失了但付费用户的订阅里显示每月增加了300次的快速请求。猜测此举是对claude模型下架的一种补偿。

来自主题: AI资讯

8221 点击 2025-11-04 13:22

11 月 2 日，英伟达首次把 H100 GPU 送入了太空。作为目前 AI 领域的主力训练芯片，H100 配备 80GB 内存，其性能是此前任何一台进入太空的计算机的上百倍。在轨道上，它将测试一系列人工智能处理应用，包括分析地球观测图像和运行谷歌的大语言模型（LLM）。

来自主题: AI资讯

7685 点击 2025-11-04 12:09

昨天一大早，就发现美团开源了他们首款全模态实时交互大模型：LongCat-Flash-Omni。

来自主题: AI技术研报

9239 点击 2025-11-04 11:57

是孩子该看的东西。

来自主题: AI资讯

9120 点击 2025-11-04 11:55

当下的文本生成图像扩散模型取得了长足进展，为图像生成引入布局控制（Layout-to-Image, L2I）成为可能。

来自主题: AI技术研报

5659 点击 2025-11-04 11:33