摘要
本发明涉及数据处理技术领域,公开了一种基于向量数据库和大模型的数据处理系统及方法,其中系统包括:内容向量化模块,用于将文档内容转化为内容向量;向量数据库模块,用于构建索引获得索引向量数据库;知识提取模块,用于将问题向量与索引向量数据库中最相关内容向量对应的文档内容通过大模型进行优化作为决策支持结果输出;相关推荐模块,将问题向量与索引向量数据库之间的向量相似度高于相似度最低阈值的内容向量对应的文档内容作为相关结果输出。本发明实现了PPT文件的自动化知识提取与高效检索,还能通过语义理解生成专业的答案,并附加相关文档链,降低用户获取所需信息的时间成本,提升了企业内部文档的利用率。