AI资讯新闻榜单内容搜索-Dia

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Dia
Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

NVIDIA Dynamo 团队发现,Claude Code 向自定义端点发送请求时,prompt 最前面会带一行 session-specific billing header。这行 header 每个 session 都变,导致 52K token 的稳定前缀在 KV cache 中无法复用——TTFT 从 168ms 飙到 912ms。Dynamo 加了一个 `

来自主题: AI资讯
9891 点击    2026-05-11 11:01
27k Stars,零行代码 —— kepano/obsidian-skills 凭什么?

27k Stars,零行代码 —— kepano/obsidian-skills 凭什么?

27k Stars,零行代码 —— kepano/obsidian-skills 凭什么?

随手打开 GitHub,2026 年的 Agent 项目热榜上有这样一个仓库: • 27,000+ stars,1,800+ forks • 零行 Python,零行 TypeScript,零行 JS • 作者是 Obsidian 的 CEO 本人,kepano • 整个仓库就是 5 个 Markdown 文件

来自主题: AI资讯
9025 点击    2026-05-09 10:34
Obsidian 是 AI 时代最强的「写作+知识库」|万字讲解,我的 9 个真实工作流公开

Obsidian 是 AI 时代最强的「写作+知识库」|万字讲解,我的 9 个真实工作流公开

Obsidian 是 AI 时代最强的「写作+知识库」|万字讲解,我的 9 个真实工作流公开

最近很多朋友问我用什么笔记软件。我说 Obsidian。其中一个主要原因是:大家使用 Obsidian 的时间点是在「AI 时代」之前,而现在,Claude Code 时代下的 Obsidian 已经完全完全成了「最强笔记软件」。

来自主题: AI资讯
9079 点击    2026-05-02 13:39
不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

不换GPU,性能飙升2.8倍!英伟达用软件暴打摩尔定律

MoE模型的稀疏激活本是优势,却常陷通信瓶颈。NVIDIA以软件为利剑,通过程序化依赖启动和全对全通信革新,在三个月内将GB200的单GPU吞吐提升2.8倍,真正释放Blackwell硬件潜力。

来自主题: AI技术研报
9108 点击    2026-04-28 10:09
老黄100%免费开源!老照片炸成可漫游3D宇宙

老黄100%免费开源!老照片炸成可漫游3D宇宙

老黄100%免费开源!老照片炸成可漫游3D宇宙

谷歌还在闭源守宝,NVIDIA已把Lyra 2.0全开源:35步去噪变4步,2D图片直出3D高斯泼溅+网格。社交狂欢背后,是对具身AI仿真的巨大潜力——以后造世界,不用再去真实世界采数据了。

来自主题: AI资讯
8122 点击    2026-04-27 10:01
速递|AI存储Vast Data融资10亿美元,估值300亿美元,IPO进行中

速递|AI存储Vast Data融资10亿美元,估值300亿美元,IPO进行中

速递|AI存储Vast Data融资10亿美元,估值300亿美元,IPO进行中

由 NVIDIA 支持的 Vast Data (一家为人工智能任务开发数据存储软件的公司)表示,已筹集约 10 亿美元,估值超过三倍增至 300 亿美元。

来自主题: AI资讯
7884 点击    2026-04-26 11:56
英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅

英伟达良心福利!免费领一年顶级大模型订阅,MiniMax / Kimi / DeepSeek 全都能用!NVIDIA 官方平台build.nvidia.com开放了一批"Free Endpoint"模型,注册账号、验证手机号后就能生成一把最长有效期12 个月的 API Key,免费调用几十个当下最火的大模型——不计 Token、无余额限制、无需信用卡。

来自主题: AI资讯
9562 点击    2026-04-21 09:17
训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力,推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL,通过「FP4 先探索、BF16 再训练」的后训练框架,将达到等效 reward 水平的收敛速度最高提升到 4.64x,在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报
8970 点击    2026-04-16 16:07
速递|NVIDIA站台开源AI芯片SiFive,本轮融资获4亿美元,GPU+开放CPU生态双轨并行

速递|NVIDIA站台开源AI芯片SiFive,本轮融资获4亿美元,GPU+开放CPU生态双轨并行

速递|NVIDIA站台开源AI芯片SiFive,本轮融资获4亿美元,GPU+开放CPU生态双轨并行

SiFive 是一家由加州大学伯克利分校工程师创办的公司,这些工程师创造了开源芯片设计,该公司已获得一轮超额认购的 4 亿美元融资,公司估值达 36.5 亿美元。

来自主题: AI资讯
7635 点击    2026-04-13 14:33