AI资讯新闻榜单内容搜索-Ash

FlashAttention-4正式发布：算法流水线大改，矩阵乘法级速度

近日，深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示，在 Blackwell GPU 上，即使瓶颈截然不同，注意力机制的执行速度现在也几乎与矩阵乘法一样快了！

来自主题: AI技术研报

10328 点击 2026-03-06 15:30

谷歌、OpenAI同日发布模型，一个最快最具性价比，一个主打「人情味」

深夜，两大科技巨头谷歌和 OpenAI 硬刚起来，相继推出了新版本大模型，分别是 Gemini 3.1 Flash-Lite、GPT‑5.3 Instant。

来自主题: AI资讯

6607 点击 2026-03-04 14:37

为什么BF16的FlashAttention会把训练「炸掉」？清华首次给出机制解释，用极简改动稳住训练

一句话总结：社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了：在 BF16 等低精度训练里，FlashAttention 不是随机出 bug，而是会在特定条件下触发有方向的数值偏置，借助注意力中涌现的相似低秩更新方向被持续放大，最终把权重谱范数和激活推到失控，导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改，实测能显著稳定训练。

来自主题: AI技术研报

6899 点击 2026-03-04 13:49

谷歌深夜放性价比“猛兽”！Gemini 3.1 Flash轻量版干翻前辈，价格打骨折

首Token提速2.5倍，推理成绩干翻前代大模型。

来自主题: AI资讯

6738 点击 2026-03-04 11:29

MWC围观、OpenClaw屠榜！2026 AI变天：从“陪聊”到“干活”，中国开源模型成全球开发者首选

阶跃星辰Step 3.5 Flash霸榜OpenClaw调用排行，全球开发者正在“用脚投票”AI新方向。

来自主题: AI资讯

9387 点击 2026-03-04 11:24

OpenClaw杀出中国黑马，全球开发者狂呼真香！一场深夜AMA撕开底牌

OpenClaw爆火，AI正式步入Agent时代。一支低调的中国团队凭借极速推理、完美适配128G内存的196B模型，直击痛点，强势登顶海外热榜。

来自主题: AI资讯

9193 点击 2026-02-28 19:50

谷歌深夜突发Nano Banana 2，生图圈天塌了！Pro级4K大片，价格砍半

一周一更，谷歌又在深夜扔出「深水炸弹」。就在刚刚，最强生图模型Nano Banana 2横空出世，背靠全新Gemini 3.1 Flash Image。它不仅生成速度飞快，多语言文字处理更强，还能实时联网，一次直出4K大片。

来自主题: AI资讯

9990 点击 2026-02-27 10:07

Nano Banana 2，泄露！

过去48小时，Nano Banana 2成为AI开发者圈的热议话题。在海外社交平台X上，关于谷歌这款最新图片生成模型（又名Gemini 3.1 Flash Image预览版）将发布的帖子层出不穷，4K图片四处流传，各种猜测也甚嚣尘上。

来自主题: AI资讯

9620 点击 2026-02-25 21:41

单个LLM已不够？华盛顿大学开源多模型协同框架MoCo

为了支持多模型协同研究并加速这一未来愿景的实现，华盛顿大学 (University of Washington) 冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出 MoCo—— 一个针对多模型协同研究的 Python 框架。MoCo 支持 26 种在不同层级实现多模型交互的算法，研究者可以灵活自定义数据集、模型以及硬件配置，比较不同算法，优化自身算法，以此构建组合式人工智能系统。MoCo 为设计、

来自主题: AI技术研报

9603 点击 2026-02-18 13:24

蚂蚁全模态模型开源！首创人声配乐音效一次生成，图像编辑指哪改哪

这个国产开源模型，把多模态玩出了“魔法”感。

来自主题: AI技术研报

9467 点击 2026-02-12 15:38