面向边缘计算大模型的分布式推理任务分配方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向边缘计算大模型的分布式推理任务分配方法
申请号:CN202510320529
申请日期:2025-03-18
公开号:CN120144310A
公开日期:2025-06-13
类型:发明专利
摘要
本发明提出了一种面向边缘计算大模型的分布式推理任务分配方法,属于移动边缘计算技术领域,考虑大语言模型分布式部署场景,构建多台边缘服务器协作完成推理任务的工作流,考虑到推理任务生成式特点,采用精确二次重构;来解决推理任务资源占用的不确定性,为该场景下的边缘推理任务分配问题构建数学模型表达,目标是最大化服务商收益,将构建的数学模型重构为一个组合选择问题,采用对偶方法给出有理论保证的近似解,对服务商的推理任务分配决策进行优化,从而最大化服务商收益。
技术关键词
服务器 任务分配方法 构建数学模型 大语言模型 阶段 移动边缘计算技术 重构 工作流 多层感知机层 资源 注意力 决策 场景 定义 变量 理论 令牌 松弛