AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
Agent怎么运维?中科院清华重磅发布:AgentOps来了!

Agent怎么运维?中科院清华重磅发布:AgentOps来了!

Agent怎么运维?中科院清华重磅发布:AgentOps来了!

从“模型即服务”(MaaS)到“智能体即服务”(AaaS)的转变,标志着AI行业进入了新的发展阶段。我们不再满足于AI的“对话能力”,而是期望它能成为自主完成复杂任务的“全能机器人”。

来自主题: AI资讯
5617 点击    2025-08-09 10:55
从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

从Debugger到Developer : 低代码时代新基准NoCode-bench,SWE-Bench作者力荐

当前,大型语言模型(LLM)在软件工程领域的应用日新月异,尤其是在自动修复 Bug 方面,以 SWE-bench 为代表的基准测试展示了 AI 惊人的潜力。然而,软件开发远不止于修 Bug,功能开发与迭代才是日常工作的重头戏。

来自主题: AI技术研报
6567 点击    2025-08-08 17:01
无需外部数据!AI自问自答实现推理能力进化

无需外部数据!AI自问自答实现推理能力进化

无需外部数据!AI自问自答实现推理能力进化

AI通过自问自答就能提升推理能力?! 这正是卡内基梅隆大学团队提出的新框架SQLM——一种无需外部数据的自我提问模型。

来自主题: AI资讯
6075 点击    2025-08-08 16:56
AI界拼多多,首篇分析agent能效比的系统性工作!

AI界拼多多,首篇分析agent能效比的系统性工作!

AI界拼多多,首篇分析agent能效比的系统性工作!

一句话概括,花大价钱请来的AI智能体天天搁那儿“过度思考”,这篇论文教你如何让它“该省省该花花”,别再当冤大头了,当你给智能体卸掉复杂记忆/冗余规划这些"奢侈品"后,发现它跑得比香港记者还快还便宜。

来自主题: AI资讯
6648 点击    2025-08-08 13:37
颠覆互联网的下一波浪潮:Agentic Web来了!

颠覆互联网的下一波浪潮:Agentic Web来了!

颠覆互联网的下一波浪潮:Agentic Web来了!

过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。如今,我们正站在互联网的另一个重大转折点上。 这一转折,来自一种全新的范式设想 —— Agentic Web,一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中,用户不再手动浏览网页、点击按钮,而是通过自然语言向智能体发出一个目标,AI 会自主规划、搜索、调用服务、协调其他智能体,最终完成复杂任务。

来自主题: AI技术研报
7565 点击    2025-08-08 12:03
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构

自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报
6942 点击    2025-08-08 11:52
让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题

让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题

让AI读懂「言外之意」:AI4SG团队发布首个心理健康污名语料库,破解隐性偏见识别难题

心理健康问题影响着全球数亿人的生活,然而患者往往面临着双重负担:不仅要承受疾病本身的痛苦,还要忍受来自社会的偏见和歧视。世界卫生组织数据显示,全球有相当比例的心理健康患者因为恐惧社会歧视而延迟或拒绝治疗。

来自主题: AI技术研报
6464 点击    2025-08-08 11:41
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

众所周知,大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。

来自主题: AI技术研报
7738 点击    2025-08-08 11:22