一种基于语义通信的大语言模型推理调度方法和装置

申请号：CN202511111753

申请日期：2025-08-08

公开号：CN120750491A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于语义通信的大语言模型推理调度方法和装置，包括：边缘设备通过联合轻量模型提取推理请求的语义信息后预测输出token长度并上传至大语言模型服务器；大语言模型服务器根据语义调度评分函数对等待请求排序，评分函数基于token长度、信道质量和历史重传次数动态加权计算，选取优先级最高的请求组并指示对应的边缘设备上传由联合轻量模型提取的推理请求的语义张量；大语言模型服务器接收语义张量后重构信息进行批次推理。本发明能有效提升推理系统在高并发环境下的吞吐能力，降低任务响应时延，增强边缘语义通信系统的稳定性与服务质量，对大语言模型在边缘计算与多用户语义通信场景下的部署具有广泛适用性与推广价值。

技术关键词

大语言模型通用编码器通信基站语义向量服务器推理系统分布式边缘平均等待时间信道动态重构残差模块调度装置表达式监控模块策略标签

系统为您推荐了相关专利信息

配电室巡检机器人系统

巡检机器人系统传感器系统配电室巡检机器人 DC电机客户端

预训练语言模型微调方法及其相关应用

预训练语言模型大语言模型微调方法非暂时性机器可读存储介质计算机程序指令

一种基于语义化的电池故障诊断大语言模型算法及电池交互管理平台

电池故障诊断大语言模型新能源汽车电池实时数据电池单体

一种基于显式反馈的人力资源增强推荐方法及装置

推荐方法推荐装置文本列表摘要

设备加热电路及服务器

加热电路电源切换电路加热控制电路晶体管电池模组