概述
项目旨在搭建基于自主LoongArch指令集的龙芯3A5000处理器的AI异构平台,在整机硬件研制、AI芯片适配、AI算法优化、典型应用构建等方面开展研究,解决CPU与GPU/ASIC总线互联设计技术、系统前端设计技术、基于高效管道和优化器的快速训练技术、基于自蒸馏的深度模型压缩技术等关键技术。
通过合作开发,预期形成基于LoongArch指令集的异构AI计算机,实现对3款主流AI芯片板卡的适配与优化;深度快速训练技术可减少训练时间20%以上;基于自蒸馏的模型压缩技术可压缩模型尺寸30%以上,减少计算量30%以上。