AI资讯新闻榜单内容搜索-智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 智能体
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”

来自主题: AI技术研报
5761 点击    2026-01-13 16:36
Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

在文章开始前,请您先打开Claude code,输入/skill,检查一下您的Claude code有多少个skills?是20个?50个?还是已经突破了100个?自从Anthropic推广Agent Skills以来,我们都爱上了这种“即插即用”的模块化体验。它把臃肿的多智能体编排(MAS)变成了一组优雅的Markdown文件调用,让API账单和延迟同时暴跌了50%以上。

来自主题: AI技术研报
9925 点击    2026-01-13 09:09
用户与AI聊黄,开发者获刑,国内首起AI服务提供者涉黄获刑案件一审宣判

用户与AI聊黄,开发者获刑,国内首起AI服务提供者涉黄获刑案件一审宣判

用户与AI聊黄,开发者获刑,国内首起AI服务提供者涉黄获刑案件一审宣判

因为大量用户在APP上与AI智能体“聊黄”,APP的主要开发和运营者被追究了刑责。2025年9月,上海市徐汇区人民法院一审判决,两名被告人犯制作淫秽物品牟利罪,分别获刑四年、一年半。此案成为国内首起AI服务提供者涉黄获刑的案件。

来自主题: AI资讯
9492 点击    2026-01-12 21:05
DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

DeepMind发布SIMA 2!打通「感知-推理-行动-反思」闭环

Deepmind推出的SIMA 2,让智能体能在虚拟环境(商业游戏)中,边聊天边进行复杂的多模态推理。作为具身通用智能的原型,SIMA 2已从静态数据集迈向无限程序化生成的训练场。

来自主题: AI技术研报
7625 点击    2026-01-12 10:00
智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了

智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了

智能体「卷王」诞生!干活自动配结项报告,1.5张截图就把事说清了

SmartSnap的核心思想是将GUI智能体从“被动的执行者”转变为“主动的自证者”。简单来说,智能体在完成任务的同时,还会主动收集、筛选并提交一份“证据快照集”。

来自主题: AI技术研报
8514 点击    2026-01-11 10:01
做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

做题家vs科学家:一个30B模型如何颠覆万亿参数的AI军备竞赛

2026年1月5日,由陈天桥和清华AI学者代季峰联合发起的MiroMind团队,正式发布了自研旗舰搜索智能体模型MiroThinker 1.5。这个消息本身并不算特别,毕竟最近几个月几乎每周都有新模型发布。但当我深入了解后发现,这个模型背后代表的思路,可能会彻底改变我们对AI能力边界的认知。

来自主题: AI资讯
8023 点击    2026-01-10 10:51
大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL

近日,清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习,让大模型在策略游戏中进行自博弈(Self-Play)。实验表明,这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水

来自主题: AI技术研报
8316 点击    2026-01-10 10:16
一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

一口气集齐老黄苏妈英特尔,还得是AI,还得是联想

联想给出的公式是,混合AI=个人智能+企业智能+公共智能。这种模式下,AI智能体应用不再依赖于单一的云端模型,而是云端大模型与本地定制化小模型的深度融合。

来自主题: AI资讯
8527 点击    2026-01-09 14:41
Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗

百炼升级了其提出的「1+2+N」的蓝图:其中最底层的 1 是模型与云服务,中间层的 2 是高代码、低代码的开发范式,在最上层的 N 则是面向不同任务的开发组件。这套能力覆盖了生产级智能体构建的全生命周期。

来自主题: AI资讯
8952 点击    2026-01-09 14:39
AI月产十亿行代码,暴增76%!程序员论坛炸锅:代码行数≠生产力!

AI月产十亿行代码,暴增76%!程序员论坛炸锅:代码行数≠生产力!

AI月产十亿行代码,暴增76%!程序员论坛炸锅:代码行数≠生产力!

想知道硅谷的程序员怎么使用AI编程,被2000家公司使用的AI代码审查智能体Greptile基于每月用AI审核的的十亿行代码,发布了AI编程年度报告,揭示了使用AI编程后带来的生产率提升,但对此程序员们却无法感同身受。

来自主题: AI技术研报
8235 点击    2026-01-09 11:47