面向边缘计算大模型的分布式推理任务分配方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
面向边缘计算大模型的分布式推理任务分配方法
申请号:
CN202510320529
申请日期:
2025-03-18
公开号:
CN120144310A
公开日期:
2025-06-13
类型:
发明专利
摘要
本发明提出了一种面向边缘计算大模型的分布式推理任务分配方法,属于移动边缘计算技术领域,考虑大语言模型分布式部署场景,构建多台边缘服务器协作完成推理任务的工作流,考虑到推理任务生成式特点,采用精确二次重构;来解决推理任务资源占用的不确定性,为该场景下的边缘推理任务分配问题构建数学模型表达,目标是最大化服务商收益,将构建的数学模型重构为一个组合选择问题,采用对偶方法给出有理论保证的近似解,对服务商的推理任务分配决策进行优化,从而最大化服务商收益。
技术关键词
服务器
任务分配方法
构建数学模型
大语言模型
阶段
移动边缘计算技术
重构
工作流
多层感知机层
资源
注意力
决策
场景
定义
变量
理论
令牌
松弛