摘要
本发明提供了一种基于融合架构的端侧RAG实现方法及系统,方法包括通过用户浏览器对向量化引擎进行初始化,以得到初始化向量模型;基于初始化向量模型对本地文本知识库进行向量化处理,以得到向量知识库;获取用户下发的查询文本,基于查询文本与向量知识库进行检索查询,以输出检索结果;基于当前网络环境对全周期工作量进行智能决策,以实现动态计算卸载;对全周期数据进行加密、存储与验证,以完成端侧RAG的实现,本发明替代传统云端向量计算架构,通过纯前端计算架构实现AI工作流的零服务端成本运行,解决中心化AI平台算力贵、延迟高、隐私差三大痛点。