AI资讯新闻榜单内容搜索-推理模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 推理模型
Jack Clark: 美国 AI 政策的隐形推手,时代的良心还是囚徒?

Jack Clark: 美国 AI 政策的隐形推手,时代的良心还是囚徒?

Jack Clark: 美国 AI 政策的隐形推手,时代的良心还是囚徒?

Jack Clark 是最关注和熟悉中国在芯片、计算和模型上进展的 AI Lab 领导人之一。他毫不吝啬对中国 AI 进展的认可,将 DeepSeek R1 视作“推理模型大范围扩散”的起点,近期又把 HyperHetero 使用的异构集群叫做通过“超级智能进行持续自我训练”的垫脚石。

来自主题: AI资讯
5864 点击    2025-07-05 19:50
我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料

我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料

我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料

2025年上半年,AI开源领域的竞赛异常激烈,主要围绕着几个核心方向展开:首先是效率竞赛,各路玩家不再单纯追求千亿、万亿参数的“巨无霸”模型,而是更专注于通过新架构和训练方法,用更小的参数实现更强的性能。其次,多模态已成标配,纯文本模型越来越少,新发布的旗舰模型几乎都具备了处理图像、视频等多种信息的能力。

来自主题: AI产品测评
7822 点击    2025-07-02 17:31
只用2700万参数,这个推理模型超越了DeepSeek和Claude

只用2700万参数,这个推理模型超越了DeepSeek和Claude

只用2700万参数,这个推理模型超越了DeepSeek和Claude

像人一样推理。 大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报
5965 点击    2025-07-01 10:26
腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

腾讯混元推出首款开源混合推理模型:擅长Agent工具调用和长文理解

6 月 27 日,腾讯混元宣布开源首个混合推理 MoE 模型 Hunyuan-A13B,总参数 80B,激活参数仅 13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高。模型已经在 Github 和 Huggingface 等开源社区上线,同时模型 API 也在腾讯云官网正式上线,支持快速接入部署。

来自主题: AI资讯
5552 点击    2025-06-28 17:49
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward

来自主题: AI技术研报
8192 点击    2025-06-27 10:03
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

强化学习(RL)已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习(Agentic RL),你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

来自主题: AI技术研报
5797 点击    2025-06-22 16:08
坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

坏了!R1的秘密被Deepmind发现了!「啊哈时刻」首次被披露,现已可量化!

自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。

来自主题: AI资讯
5595 点击    2025-06-21 13:01
AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

AI自己给自己当网管,实现安全“顿悟时刻”,风险率直降9.6%

大型推理模型(LRMs)在解决复杂任务时展现出的强大能力令人惊叹,但其背后隐藏的安全风险不容忽视。

来自主题: AI技术研报
7126 点击    2025-06-14 12:35