一种基于语义通信的大语言模型推理调度方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于语义通信的大语言模型推理调度方法和装置
申请号:CN202511111753
申请日期:2025-08-08
公开号:CN120750491A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种基于语义通信的大语言模型推理调度方法和装置,包括:边缘设备通过联合轻量模型提取推理请求的语义信息后预测输出token长度并上传至大语言模型服务器;大语言模型服务器根据语义调度评分函数对等待请求排序,评分函数基于token长度、信道质量和历史重传次数动态加权计算,选取优先级最高的请求组并指示对应的边缘设备上传由联合轻量模型提取的推理请求的语义张量;大语言模型服务器接收语义张量后重构信息进行批次推理。本发明能有效提升推理系统在高并发环境下的吞吐能力,降低任务响应时延,增强边缘语义通信系统的稳定性与服务质量,对大语言模型在边缘计算与多用户语义通信场景下的部署具有广泛适用性与推广价值。
技术关键词
大语言模型 通用编码器 通信基站 语义向量 服务器 推理系统 分布式边缘 平均等待时间 信道 动态 重构 残差模块 调度装置 表达式 监控模块 策略 标签
系统为您推荐了相关专利信息
巡检机器人系统 传感器系统 配电室巡检机器人 DC电机 客户端
预训练语言模型 大语言模型 微调方法 非暂时性机器可读存储介质 计算机程序指令
电池故障诊断 大语言模型 新能源汽车电池 实时数据 电池单体
推荐方法 推荐装置 文本 列表 摘要
加热电路 电源切换电路 加热控制电路 晶体管 电池模组