AI资讯新闻榜单内容搜索-模型推理

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型推理

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

近日，无问芯穹发起了一次推理系统开源节，连续开源了三个推理工作，包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD、低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap，为高效的推理系统设计提供多层次助力。下面让我们一起来对这三个工作展开一一解读：

来自主题: AI技术研报

9102 点击 2025-04-30 08:50

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

多模态大模型（MLLMs）在视觉理解与推理等领域取得了显著成就。然而，随着解码（decoding）阶段不断生成新的 token，推理过程的计算复杂度和 GPU 显存占用逐渐增加，这导致了多模态大模型推理效率的降低。

来自主题: AI技术研报

7062 点击 2025-04-29 14:56

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

DeepSeek-R1 展示了强化学习在提升模型推理能力方面的巨大潜力，尤其是在无需人工标注推理过程的设定下，模型可以学习到如何更合理地组织回答。然而，这类模型缺乏对外部数据源的实时访问能力，一旦训练语料中不存在某些关键信息，推理过程往往会因知识缺失而失败。

来自主题: AI技术研报

7943 点击 2025-04-22 09:02

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

阿里智能化研发起飞！RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

RTP-LLM 是阿里巴巴大模型预测团队开发的高性能 LLM 推理加速引擎。它在阿里巴巴集团内广泛应用，支撑着淘宝、天猫、高德、饿了么等核心业务部门的大模型推理需求。在 RTP-LLM 上，我们实现了一个通用的投机采样框架，支持多种投机采样方法，能够帮助业务有效降低推理延迟以及提升吞吐。

来自主题: AI技术研报

7387 点击 2025-04-14 15:13

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

拿20年前的苹果“古董”笔记本跑模型推理：九分之一现代CPU速度，但成功了

众所周知，大语言模型（LLM）往往对硬件要求很高。

来自主题: AI资讯

3773 点击 2025-04-09 08:51

Kimi 开放平台产品价格调整通知

Kimi 开放平台产品价格调整通知

Kimi 开放平台产品价格调整通知

Kimi 开放平台的朋友们，基于 Moonshot AI 一年来的技术积累和性能优化，我们已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整，具体调整方案如下：

来自主题: AI资讯

4579 点击 2025-04-08 09:49

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

三思而后行，让大模型推理更强的秘密是「THINK TWICE」？

近年来，大语言模型（LLM）的性能提升逐渐从训练时规模扩展转向推理阶段的优化，这一趋势催生了「测试时扩展（test-time scaling）」的研究热潮。

来自主题: AI技术研报

9178 点击 2025-04-06 16:55

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek新论文来了！在清华研究者共同发布的研究中，他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2，果然近了。

来自主题: AI技术研报

8713 点击 2025-04-05 01:14

自动学会工具解题，RL扩展催化奥数能力激增17%

自动学会工具解题，RL扩展催化奥数能力激增17%

自动学会工具解题，RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中，工具使用一直是克服语言模型计算局限性的关键路径。不过，当今的大模型在使用工具方面还存在一些局限，比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。

来自主题: AI技术研报

9515 点击 2025-04-02 10:09

树搜索也存在「过思考」与「欠思考」？腾讯AI Lab与厦大联合提出高效树搜索框架

树搜索也存在「过思考」与「欠思考」？腾讯AI Lab与厦大联合提出高效树搜索框架

树搜索也存在「过思考」与「欠思考」？腾讯AI Lab与厦大联合提出高效树搜索框架

本文探讨基于树搜索的大语言模型推理过程中存在的「过思考」与「欠思考」问题，并提出高效树搜索框架——Fetch。本研究由腾讯 AI Lab 与厦门大学、苏州大学研究团队合作完成。

来自主题: AI技术研报

5437 点击 2025-03-22 11:06

上一页当前第6页,共11页下一页