AI资讯新闻榜单内容搜索-2

妈妈再也不用担心延迟了！斯坦福手搓Llama超级内核，推理仅需0.00068秒

斯坦福Hazy实验室推出新一代低延迟推理引擎「Megakernel」，将Llama-1B模型前向传播完整融合进单一GPU内核，实现推理时间低于1毫秒。在B200上每次推理仅需680微秒，比vLLM快3.5倍。

来自主题: AI技术研报

10417 点击 2025-05-30 12:36

近日，NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM，以无需训练的即插即用加速方案，实现了推理速度的突破！通过创新的技术组合，在不依赖重新训练模型的前提下，该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据，解析其核心优势。

来自主题: AI技术研报

10359 点击 2025-05-30 12:08

当别人还在抢流量，快手已经在抢效率了。5月27日，快手发布2025年第一季度财报。其营收同比增长10.9%至326亿元，经调整净利润达46亿元，保持8个季度盈利，经调整净利润率提升至14%。

来自主题: AI资讯

9467 点击 2025-05-30 11:26

Context 是一家开发人工智能办公套件的初创公司，于5 月 28 日宣布完成 1100 万美元种子轮融资，由 Lux Capital 领投，高通创投和 General Catalyst 跟投。此轮融资使公司总融资额达到约 1575 万美元，估值达 7000 万美元。

来自主题: AI资讯

6936 点击 2025-05-29 18:32

英伟达赚麻了！AI推理全面爆发，芯片巨头2026财年Q1营收达441亿美元，净利润飙升至188亿美元，双双远超市场预期！

来自主题: AI资讯

11090 点击 2025-05-29 18:22

EfficientLLM项目聚焦LLM效率，提出三轴分类法和六大指标，实验包揽全架构、多模态、微调技术，可为研究人员提供效率与性能平衡的参考。

来自主题: AI技术研报

9585 点击 2025-05-29 17:16

DeepSeek 猝不及防地更新了，不是 R2，而是 R1 v2。

来自主题: AI资讯

9214 点击 2025-05-29 17:09

对于会计部门而言，总账系统是最为关键的软件。作为汇总所有财务交易的核心枢纽，它提供了生成准确财务报表所需的基础数据。本周三，Rillet 宣布完成 2500 万美元 A 轮融资，由红杉资本领投，现有投资者跟投。

来自主题: AI资讯

12366 点击 2025-05-29 16:50

刚刚，可灵2.1正式上线了。

来自主题: AI资讯

9505 点击 2025-05-29 16:42

视觉语言模型（Vision-Language Models, VLMs），为真实环境中的机器人操作任务提供了极具潜力的解决方案。

来自主题: AI技术研报

11016 点击 2025-05-29 16:33