AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1的英伟达开源新王Llama-Nemotron，是怎么训练出来的？刚刚放出的论文，把一切细节毫无保留地全部揭秘了！

来自主题: AI技术研报

8959 点击 2025-05-06 17:08

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

9942 点击 2025-05-06 15:07

如何在LLM「排行榜幻象」中导航？2025AI界震撼大瓜，披露学术造假

如何在LLM「排行榜幻象」中导航？2025AI界震撼大瓜，披露学术造假

如何在LLM「排行榜幻象」中导航？2025AI界震撼大瓜，披露学术造假

你信任的AI排行榜，可能只是一场精心策划的骗局！震惊业界的Cohere Labs最新研究彻底撕破了Chatbot Arena这一所谓"黄金标准"的华丽面纱，揭露了科技巨头们如何肆无忌惮地操控评估系统、掠夺社区资源、扼杀开源创新。

来自主题: AI技术研报

8665 点击 2025-05-06 15:00

ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键

ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键

ICML 2025 | 注意力机制中的极大值：破解大语言模型上下文理解的关键

大型语言模型（LLMs）在上下文知识理解方面取得了令人瞩目的成功。

来自主题: AI技术研报

8233 点击 2025-05-06 14:52

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

研究揭示早融合架构在低计算预算下表现更优，训练效率更高。混合专家（MoE）技术让模型动态适应不同模态，显著提升性能，堪称多模态模型的秘密武器。

来自主题: AI技术研报

10464 点击 2025-05-06 14:41

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2%

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2%

大模型集体“挂科”！全新中文网页检索测试：GPT-4o准确率仅6.2%

你以为大模型已经能轻松“上网冲浪”了？

来自主题: AI技术研报

8961 点击 2025-05-06 14:09

AI「自我复制」能力曝光！RepliBench警示：大模型正在学会伪造身份

AI「自我复制」能力曝光！RepliBench警示：大模型正在学会伪造身份

AI「自我复制」能力曝光！RepliBench警示：大模型正在学会伪造身份

科幻中AI自我复制失控场景，正成为现实世界严肃的研究课题。英国AISI推出RepliBench基准，分解并评估AI自主复制所需的四大核心能力。测试显示，当前AI尚不具备完全自主复制能力，但在获取资源等子任务上已展现显著进展。

来自主题: AI技术研报

7711 点击 2025-05-06 13:40

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

本文深入梳理了围绕DeepSeek-R1展开的多项复现研究，系统解析了监督微调（SFT）、强化学习（RL）以及奖励机制、数据构建等关键技术细节。

来自主题: AI技术研报

7460 点击 2025-05-06 10:53

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距，进行了深入研究。

来自主题: AI技术研报

8765 点击 2025-05-06 09:23

成熟的编程智能体，已经学会升级自己的系统了

成熟的编程智能体，已经学会升级自己的系统了

成熟的编程智能体，已经学会升级自己的系统了

编程智能体，几乎成为了 2025 年最热门的话题之一。不管是学术机构还是工业界，都在寻找更高效的落地路径。

来自主题: AI技术研报

9015 点击 2025-05-06 09:13

上一页当前第183页,共345页下一页