一种面向多模态大模型实时视频处理的加速方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向多模态大模型实时视频处理的加速方法
申请号:CN202510258348
申请日期:2025-03-06
公开号:CN120455702A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开一种面向多模态大模型实时视频处理的加速方法,其特征在于,包括:利用GPU的硬件编解码模块对输入的视频流进行实时解码,并通过GPU并行计算实现多路视频流的并发解码;将解码后的视频数据通过GPU核进行2D图像处理,利用自定义优化的PTX底层指令对图像进行颜色空间转换,将YUV格式转换为BGR格式,优化过程中通过整数运算替代浮点运算;通过自定义PTX指令集对GPU的执行单元进行优化,包括线程调度、内存访问模式、指令执行顺序的优化,确保数据处理过程中的并行计算加速;在GPU内部优化内存访问模式和数据传输方式,减少内存瓶颈和延迟,设计多模态视频处理流水线的显存使用与数据传输策略,避免主机端与设备端之间的无效数据传输。
技术关键词
内存访问模式 多模态 数据传输策略 实时视频 硬件编解码 动态资源调度 数据传输方式 多线程并行计算 硬件解码 GPU并行计算 多处理器 视频解码 视频分析 编解码器 设备端 视频流 指令优化 流水线