AI资讯新闻榜单内容搜索-SpikingBra

国产类脑大模型适配国产沐曦GPU！长序列推理提速超百倍，仅用2%数据匹敌主流模型

超长序列推理时的巨大开销如何降低？

来自主题: AI技术研报

10381 点击 2025-09-12 11:31

SpikingBrain借鉴大脑信息处理机制，具有线性/近线性复杂度，在超长序列上具有显著速度优势，在GPU上1M长度下TTFT 速度相比主流大模型提升26.5x， 4M长度下保守估计速度提升超过100x；

来自主题: AI技术研报

7242 点击 2025-09-09 10:25