
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办
Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办现在ChatGPT等大模型一大痛点:处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。
来自主题: AI技术研报
7406 点击 2023-12-05 17:32
现在ChatGPT等大模型一大痛点:处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。
今天,Moonshot AI 带着首个支持输入 20 万汉字的智能助手产品Kimi Chat 与大家见面了。 据我们所知,这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着 Moonshot AI 在“长文本”这一重要技术上取得了世界领先水平。