基于大模型的线下资料数字化方法、系统及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的线下资料数字化方法、系统及存储介质
申请号:CN202510179348
申请日期:2025-02-18
公开号:CN120011619A
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供了一种基于大模型的线下资料数字化方法、系统及存储介质,该方法包括:对待数字化线下资料进行文本识别,得到线下文档;将内容抽取需求与线下文档进行组合,得到资料数字化提示;将资料数字化提示输入预训练后的大模型进行内容抽取,得到资料抽取数据,对资料抽取数据进行数据校验;将数据校验后的资料抽取数据填充至线上资料模板中。本发明实施例,通过对待数字化线下资料进行文本识别,使得无需采用人工的方式进行文本的复制和粘贴,通过将资料数字化提示输入预训练后的大模型进行内容抽取,以基于大模型强大的推理能力对线下文档进行内容的自动抽取,无需采用人工的方式进行内容抽取,提高了下资料数字化效率。
技术关键词
资料 数字化方法 线下 文本识别 特征金字塔 卷积特征 数据 模板 样本 标识符 可读存储介质 语义 实体 图像 对象 模块 计算机 处理器 参数