AI资讯新闻榜单内容搜索-R1

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: R1

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在转发。再到最近，“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验，狠狠打了所有人的脸！

来自主题: AI技术研报

8756 点击 2025-06-12 11:59

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。然而再一次遭到网友质疑：怎么又不跟最新版Qwen和DeepSeek R1 0528对比？

来自主题: AI资讯

9196 点击 2025-06-11 14:23

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

视频生成1.3B碾压14B、图像生成直逼GPT-4o！港科&快手开源测试时扩展新范式

测试时扩展（Test-Time Scaling）极大提升了大语言模型的性能，涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么，什么是视觉领域的 test-time scaling？又该如何定义？

来自主题: AI技术研报

7959 点击 2025-06-10 16:18

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

7360 点击 2025-06-10 15:28

3B超越DeepSeek，大模型终于理解时间了！Time-R1一统过去/未来/生成

3B超越DeepSeek，大模型终于理解时间了！Time-R1一统过去/未来/生成

3B超越DeepSeek，大模型终于理解时间了！Time-R1一统过去/未来/生成

Time-R1通过三阶段强化学习提升模型的时间推理能力，其核心是动态奖励机制，根据任务难度和训练进程调整奖励，引导模型逐步提升性能，最终使3B小模型实现全面时间推理能力，超越671B模型。

来自主题: AI技术研报

7363 点击 2025-06-09 15:54

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

当前，强化学习（RL）在提升大语言模型（LLM）推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报

7873 点击 2025-06-09 11:02

首个多模态专用慢思考框架！超GPT-o1近7个百分点，强化学习教会VLM「三思而后行」

首个多模态专用慢思考框架！超GPT-o1近7个百分点，强化学习教会VLM「三思而后行」

首个多模态专用慢思考框架！超GPT-o1近7个百分点，强化学习教会VLM「三思而后行」

在文本推理领域，以GPT-o1、DeepSeek-R1为代表的 “慢思考” 模型凭借显式反思机制，在数学和科学任务上展现出远超 “快思考” 模型（如 GPT-4o）的优势。

来自主题: AI技术研报

8225 点击 2025-06-07 11:00

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

9232 点击 2025-06-07 10:35

速递｜AI编程黑马Anysphere再融9亿美元，14个月实现ARR1亿美元，估值破99亿美元

速递｜AI编程黑马Anysphere再融9亿美元，14个月实现ARR1亿美元，估值破99亿美元

速递｜AI编程黑马Anysphere再融9亿美元，14个月实现ARR1亿美元，估值破99亿美元

人工智能热潮使部分初创企业实现爆发式增长。但据估算，没有企业能比开发热门AI 编程助手 Cursor 的 Anysphere 增长更快。

来自主题: AI资讯

7269 点击 2025-06-06 16:01

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

大型语言模型 (LLM) 的发展日新月异，但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时，能够自主决策获取外部知识的策略？

来自主题: AI技术研报

8570 点击 2025-06-05 16:43

上一页当前第10页,共38页下一页