一种用于手持终端的音视频优化处理方法及系统

申请号：CN202511565036

申请日期：2025-10-30

公开号：CN121037602A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种用于手持终端的音视频优化处理方法及系统，涉及多媒体信号处理技术领域，包括，独立于音频编码过程，并行采用轻量级神经网络模型对原始音频数据进行实时分析，输出结构化音频语义描述符；响应于所选定的当前视频编码策略模式，动态重构视频编码器的运行参数组对同步采集的视频帧进行编码；若当前视频编码策略模式为语音活跃模式，则提升编码帧率并启动对人脸区域的感兴趣区域编码；若当前视频编码策略模式为音乐主导模式，则提升编码分辨率，若当前视频编码策略模式为静默聆听模式，则降低编码帧率与分辨率。本发明通过基于音频语义的动态视频编码策略调整，实现了视频质量、流畅度与资源消耗的精准平衡。

技术关键词

视频编码策略轻量级神经网络手持终端视频编码器感兴趣区域编码模式音视频描述符分辨率神经网络结构多媒体信号处理技术语义音频编码复杂度视频帧频域特征动态视频编码音乐