一种剧集解说文本生成方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种剧集解说文本生成方法、装置、设备及介质
申请号:CN202410878461
申请日期:2024-07-02
公开号:CN118734804A
公开日期:2024-10-01
类型:发明专利
摘要
本发明实施例公开了一种剧集解说文本生成方法、装置、设备及介质。所述方法包括:通过文字识别模型对待解说视频识别出的台词文本进行格式转换获取字幕文件;通过对所述待解说视频的音频进行特征提取获取所述台词文本所对应的音频特征,将所述音频特征通过预设分类器进行性别分类以获取台词分类文本;将所述字幕文件与所述台词分类文本输入至大语言模型中,根据所述大语言模型与预先选择的目标解说风格生成目标解说文本。通过实施本发明实施例的方法可解决现有技术中无法对剧集有效生成个性化的解说文本的问题。
技术关键词
大语言模型 音频特征 字幕 文本生成方法 风格 视频识别 多模态数据处理方法 梅尔频率倒谱系数 格式转换方法 文本生成装置 分类器 关键词 计算机设备 时间段 转换单元 处理器