AI资讯新闻榜单内容搜索-SGLang

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: SGLang

速递｜Boson AI × SGLang 发布 Higgs Audio v3 TTS：让语音智能体实时可控

速递｜Boson AI × SGLang 发布 Higgs Audio v3 TTS：让语音智能体实时可控

速递｜Boson AI × SGLang 发布 Higgs Audio v3 TTS：让语音智能体实时可控

Boson AI 与 SGLang-Omni 团队宣布，SGLang-Omni 已完成对 Higgs Audio v3 TTS 的端到端 Serving 支持。作为一家成立于 2023 年的 AI 基础设施公司，李沐与 Alex Smola共同创立了 Boson AI，聚焦大模型时代的系统与基础设施创新。

来自主题: AI资讯

7979 点击 2026-06-06 10:18

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后，国产GPU正在填上CUDA护城河

老黄在北京喝豆汁「翻车」，全网笑疯了。但真正值得警惕的，是他背后那个正在长出来的「中国版CUDA生态」。从万卡集群到机器狗，从SGLang主线到AI Agent自动迁移，这家公司这次不只是秀芯片，而是在重写国产GPU的游戏规则！

来自主题: AI资讯

9934 点击 2026-05-20 15:15

国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

国产GPU首获全球顶级推理框架「原生门票」：MUSA合入SGLang主线

如果只看这场 Meetup 的嘉宾名单，你大概会先想到海外芯片巨头，或者某家国际 AI 基础设施公司。

来自主题: AI资讯

8091 点击 2026-05-15 10:37

国产GPU组了个开源局，把SGLang等核心开发者都摇来了！

国产GPU组了个开源局，把SGLang等核心开发者都摇来了！

国产GPU组了个开源局，把SGLang等核心开发者都摇来了！

没有大厂高管站台，一屋子却挤满了开源圈的熟面孔。

来自主题: AI资讯

5995 点击 2026-05-14 15:04

拿下1亿美元种子轮！SGLang团队创立RadixArk，打造下一代开放AI基础设施

拿下1亿美元种子轮！SGLang团队创立RadixArk，打造下一代开放AI基础设施

拿下1亿美元种子轮！SGLang团队创立RadixArk，打造下一代开放AI基础设施

AI 基础设施初创公司 RadixArk 宣布完成 1 亿美元种子轮融资，投后估值 4 亿美元。无论金额、估值还是投资人阵容，这都是 2026 年 AI Infra 赛道中目前最重的一笔早期下注。

来自主题: AI资讯

9996 点击 2026-05-09 08:29

致敬Kimi K2：基于slime的全流程INT4量化感知RL训练

致敬Kimi K2：基于slime的全流程INT4量化感知RL训练

致敬Kimi K2：基于slime的全流程INT4量化感知RL训练

受 Kimi K2 团队启发，SGLang RL 团队成功落地了 INT4 量化感知训练（QAT）流程方案。通过 “训练端伪量化 + 推理端真实量化（W4A16）” 的方案组合，我们实现了媲美 BF16 全精度训练的稳定性与训推一致性，

来自主题: AI技术研报

7646 点击 2026-02-04 16:32

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

8830 点击 2026-01-01 10:09

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

就在一周前，全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型，好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化，扩展到图像与视频扩散模型上，相较于先前的视频和图像生成框架，速度提升最高可达 57%：

来自主题: AI技术研报

8992 点击 2025-11-22 11:33

首个开源实现100%可复现的稳定RL训练框架来了！2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了！2次结果完全重合

首个开源实现100%可复现的稳定RL训练框架来了！2次结果完全重合

开源框架实现100%可复现的稳定RL训练！下图是基于Qwen3-8B进行的重复实验。两次运行，一条曲线，实现了结果的完美重合，为需要高精度复现的实验场景提供了可靠保障。这就是SGLang团队联合slime团队的最新开源成果。

来自主题: AI技术研报

8029 点击 2025-09-27 10:19

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速，最新投机采样训练框架开源！ SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。

来自主题: AI资讯

9188 点击 2025-07-27 13:22

上一页当前第1页,共2页下一页