一种基于三幕结构思维链和语义自洽的事件驱动故事生成方法及系统
申请号:CN202411123440
申请日期:2024-08-15
公开号:CN118939795A
公开日期:2024-11-12
类型:发明专利
摘要
本发明公开基于三幕结构思维链和语义自洽的事件驱动故事生成方法及系统,涉及自然语言处理领域。本发明在生成故事前,对示例进行优化。采用聚类算法从数据集中选取类型多样、能体现任务域的故事文本示例,让大规模语言模型能够学习到不同类型故事的写作方式;在生成故事时,将故事划分为开端、冲突和结局三个阶段,引入思维链提示技术的理念,构建三幕结构思维链模板;在生成故事后,提出一种语义自洽方法,先要求模型生成多个不同的故事文本,并利用聚类算法从中筛选出语义最为自洽的故事文本簇,之后,根据每个故事文本的连贯性和相关性评分,选定得分最高的者作为最终答案。本发明提出的方法在ROCStories数据集上达到了理想的结果。
技术关键词
故事生成方法
文本
预训练语言模型
语义向量
序列
依存句法分析
层次聚类算法
多语言
写作方式
提示技术
答案
模板
数据
自然语言
编码
元素
阶段