AI资讯新闻榜单内容搜索-模型训练

142页重磅，DeepSeek-R1的"甜蜜点"，开创了一个崭新的研究领域“思维学”。 | 最新

这是一份142页的研究论文，本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程，以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生，为我们理解和优化AI推理能力提供了宝贵框架。

来自主题: AI技术研报

8517 点击 2025-04-17 14:26

向量模型的核心功能是测量语义相似度，但这个测量结果很容易受到多种干扰因素的影响。在本文中，我们将着眼于文本向量模型中一个普遍存在的偏差来源：输入内容的长度。

来自主题: AI技术研报

10839 点击 2025-04-17 14:19

当前，所有主流的视觉基础模型（如 SigLIP、DINOv2 等）都仍然在低分辨率（如 384 * 384 分辨率）下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率，这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。

来自主题: AI技术研报

7731 点击 2025-04-17 13:54

模型正重塑我们的社会文化生态，但其本质常被误解。《Science》上的一篇最新文章，揭示大模型并非自主智能主体，而是一种革命性文化社会技术，类似于语言、印刷与市场制度。它以独特方式汇聚并重构人类信息，成为“人类社会人工系统”的新变体。

来自主题: AI资讯

6706 点击 2025-04-17 13:48

如何让 AI 像人一样思考？如何拥有像人一样的认知能力和社会能力？

来自主题: AI技术研报

9571 点击 2025-04-17 10:27

GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力：理解上下文关联、拆解多步骤问题、甚至通过思维链（Chain - of - Thought）进行自我验证、自我反思等推理过程。

来自主题: AI技术研报

7781 点击 2025-04-17 10:00

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reasoning Large Language Models，RLLMs）表现尤为亮眼。但它们为何如此强大呢？

来自主题: AI技术研报

10006 点击 2025-04-16 15:00

港中文和清华团队推出Video-R1模型，首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集，Video-R1在视频空间推理测试中超越了GPT-4o，展现了强大的推理能力，并且全部代码和数据集均已开源。

来自主题: AI技术研报

9852 点击 2025-04-16 14:42

能处理任意条件组合的新生成框架来了！

来自主题: AI技术研报

8113 点击 2025-04-16 14:34

在京东广告的大模型应用架构中，召回环节至关重要。传统召回方式在规则灵活性和用户需求捕捉上存在局限，而大模型带来了新的契机，但也面临训练成本和隐私保护的挑战。

来自主题: AI技术研报

7832 点击 2025-04-16 14:27