动态路由混合专家模型的推理方法、系统、设备及介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
动态路由混合专家模型的推理方法、系统、设备及介质
申请号:
CN202511537028
申请日期:
2025-10-27
公开号:
CN120996216A
公开日期:
2025-11-21
类型:
发明专利
摘要
本发明公开了一种动态路由混合专家模型的推理方法、系统、设备及介质,它们是相对应的方案,方案中:通过自动化的并行策略搜索,本发明能将模型切分为运行时间均衡的流水线阶段,减少计算单元的空闲率,进而有效地提升计算单元的执行效率;并且,本发明的自动化搜索过程通过细粒度的并行策略划分,能够在满足内存限制的情况下尽可能降低最大的流水线阶段运行时间,从而提高模型的推理性能。
技术关键词
并行策略
流水线
阶段
推理方法
模块
内存
动态
变换器
注意力
节点
符号
推理系统
序列
处理器
分析工具
定义
框架
可读存储介质
数据