片段级对齐数据自动构建方法、设备及可读存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
片段级对齐数据自动构建方法、设备及可读存储介质
申请号:
CN202510891918
申请日期:
2025-06-30
公开号:
CN120743282A
公开日期:
2025-10-03
类型:
发明专利
摘要
本发明提出片段级对齐数据自动构建方法、设备及可读存储介质,属于数据处理技术领域,为解决现有数据对齐方法中构建的程序级对齐数据,不利于模型学习语法对齐知识,且未提及如何构建片段级对比数据的问题,包括:S1:基于大模型对源语言程序插入注释;S2:根据插入注释后的源语言程序对目标程序进行改写,在目标程序中生成和源语言程序内容和顺序一致的注释;S3:将源语言程序和目标程序分割为包含对应注释的若干个代码片段,根据代码片段的注释对源语言程序和目标程序的代码片段进行一一匹配,得到片段级对齐数据。
技术关键词
自动构建方法
程序
数据对齐方法
大语言模型
数据处理技术
处理器
计算机设备
可读存储介质
存储器