突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。
来自主题: AI技术研报
8191 点击 2025-08-21 11:33
搜索
AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。