AI资讯新闻榜单内容搜索-训练模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练模型
零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人

零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人

零样本「即插即用」!智源开源RoboBrain-X0,一个基座模型开动不同机器人

为破解机器人产业「一机一调」的开发困境,智源研究院开源了通用「小脑基座」RoboBrain-X0。它创新地学习任务「做什么」而非「怎么动」,让一个预训练模型无需微调,即可驱动多种不同构造的真实机器人,真正实现了零样本跨本体泛化。

来自主题: AI资讯
6868 点击    2025-09-30 11:01
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长

很多人认为,Scaling Law 正在面临收益递减,因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现,哪怕模型在「单步任务」上的准确率提升越来越慢,这些小小的进步叠加起来,也能让模型完成的任务长度实现「指数级增长」,而这一点可能在现实中更有经济价值。

来自主题: AI技术研报
5797 点击    2025-09-16 15:15
深度|成立一年再获数千万融资,坚持结果交付,坚持端对端多智能体

深度|成立一年再获数千万融资,坚持结果交付,坚持端对端多智能体

深度|成立一年再获数千万融资,坚持结果交付,坚持端对端多智能体

近期,AI营销公司橙果视界(PhotoG母公司)宣布完成数千万元新一轮融资,由云天使基金领投,力合创投和金沙江联合资本跟投。本轮融资将用于进一步扩大行业数据规模,推进垂直行业后训练模型迭代,进一步加快全链路营销智能体在多行业的业务落地,持续探索能感知、决策、创造并执行的商业大脑。

来自主题: AI资讯
7148 点击    2025-09-01 15:06
最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

近日,Anthropic更新了它的消费者条款,没想竟把网友惹怒了,有的还把以往的「旧账」都翻了出来。这次网友的反应为啥这么激烈?大家可能还记得在Claude上线之初,Anthropic就坚决表示不会拿用户数据来训练模型。这次变化不仅自己打脸,还把以往一些「背刺」用户的往事都抖搂出来了。

来自主题: AI资讯
7790 点击    2025-08-31 13:31
DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

众所周知,大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。

来自主题: AI技术研报
7822 点击    2025-08-08 11:22
手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

手术刀式去噪突破LLM能力上限,从头预训练模型下游任务平均提高7.2% | 中科院&阿里

在噪声污染严重影响预训练数据的质量时,如何能够高效且精细地精炼数据? 中科院计算所与阿里Qwen等团队联合提出RefineX,一个通过程序化编辑任务实现大规模、精准预训练数据精炼的新框架。

来自主题: AI技术研报
6680 点击    2025-07-22 10:03
Z Waves|00后钢琴系女生要用Agent重做CRM,见到的第一家风投就决定投资

Z Waves|00后钢琴系女生要用Agent重做CRM,见到的第一家风投就决定投资

Z Waves|00后钢琴系女生要用Agent重做CRM,见到的第一家风投就决定投资

在大模型狂飙的时代,AI 创业被裹挟进一种“技术正统性”的焦虑:要不要训练模型?有没有算力资源?底层自研是不是护城河?但 Yiran,一位本科学钢琴、靠一段自动发邮件脚本开启创业旅程的 00 后女性创业者,选择了另一种路径——她不训练模型,不押技术论文,而是把 AI 做成一个真正能“成事”的销售助理。

来自主题: AI资讯
6782 点击    2025-07-13 12:18
Meta 的 Llama 3.1 可以回忆起第一本《哈利·波特》的 42%:新的研究可能对针对生成人工智能的版权诉讼产生重大影响

Meta 的 Llama 3.1 可以回忆起第一本《哈利·波特》的 42%:新的研究可能对针对生成人工智能的版权诉讼产生重大影响

Meta 的 Llama 3.1 可以回忆起第一本《哈利·波特》的 42%:新的研究可能对针对生成人工智能的版权诉讼产生重大影响

近年来,众多原告——包括书籍、报纸、计算机代码和照片的出版商——起诉人工智能公司使用受版权保护的材料来训练模型。所有这些诉讼中的一个关键问题是,人工智能模型如何轻易地从原告的受版权保护的内容中逐字摘录。

来自主题: AI资讯
7482 点击    2025-06-17 17:17
谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

谷歌之后,英伟达入局扩散大语言模型,Fast-dLLM推理速度狂飙27.6倍

近日,NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM,以无需训练的即插即用加速方案,实现了推理速度的突破!通过创新的技术组合,在不依赖重新训练模型的前提下,该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据,解析其核心优势。

来自主题: AI技术研报
8103 点击    2025-05-30 12:08