江西脑控科技有限公司刘雨飏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西脑控科技有限公司申请的专利一种基于融合架构的端侧RAG实现方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121029322B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511555268.6,技术领域涉及:G06F9/455;该发明授权一种基于融合架构的端侧RAG实现方法及系统是由刘雨飏;李婷;黄学坚;陈玮;陈斌;刘宇航;薛连丽;刘骏;徐玉朝设计研发完成,并于2025-10-29向国家知识产权局提交的专利申请。
本一种基于融合架构的端侧RAG实现方法及系统在说明书摘要公布了:本发明提供了一种基于融合架构的端侧RAG实现方法及系统,方法包括通过用户浏览器对向量化引擎进行初始化,以得到初始化向量模型;基于初始化向量模型对本地文本知识库进行向量化处理,以得到向量知识库;获取用户下发的查询文本,基于查询文本与向量知识库进行检索查询,以输出检索结果;基于当前网络环境对全周期工作量进行智能决策,以实现动态计算卸载;对全周期数据进行加密、存储与验证,以完成端侧RAG的实现,本发明替代传统云端向量计算架构,通过纯前端计算架构实现AI工作流的零服务端成本运行,解决中心化AI平台算力贵、延迟高、隐私差三大痛点。
本发明授权一种基于融合架构的端侧RAG实现方法及系统在权利要求书中公布了:1.一种基于融合架构的端侧RAG实现方法,其特征在于,包括: 获取用户浏览器,通过所述用户浏览器对向量化引擎进行初始化,以得到初始化向量模型; 获取用户的本地文本知识库,基于所述初始化向量模型对所述本地文本知识库进行向量化处理,以得到向量知识库; 获取用户下发的查询文本,基于所述查询文本与所述向量知识库进行检索查询,以输出检索结果; 识别全周期工作量,基于当前网络环境对所述全周期工作量进行智能决策,以实现动态计算卸载,所述全周期工作量包括初始化工作、向量化工作、检索查询工作; 识别全周期数据,对所述全周期数据进行加密、存储与验证,以完成端侧RAG的实现,所述全周期数据包括本地文本知识库中的数据、向量知识库中的数据、检索结果中的数据; 所述基于当前网络环境对所述全周期工作量进行智能决策,以实现动态计算卸载的步骤包括: 测量用户所用网络的当前可用带宽,基于所述当前可用带宽计算卸载值: ; 式中,为全周期工作量的任务计算量,为本地计算时间阈值; 若所述卸载值为,则强制所述全周期工作量中的所有工作量在本地完成; 若所述卸载值为,则将所述全周期工作量中的最密集任务工作卸载到云端并将所述全周期工作量中的其余工作在本地完成,以实现动态计算卸载; 所述识别全周期数据,对所述全周期数据进行加密、存储与验证,以完成端侧RAG的实现的步骤包括: 使用用户浏览器内置的WebCrypto API并采用预设加密算法对所述全周期数据进行加密处理,以得到加密数据; 将所述加密数据存储在用户浏览器的IndexedDB中,由用户密码通过密钥派生函数生成加密密钥并将所述加密密钥发送至用户; 识别用户的敏感操作,并通过WASM模型对敏感操作进行验证,以完成端侧RAG的实现: ; 式中,为验证函数,分别为公共参数、输入数据、证明。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西脑控科技有限公司,其通讯地址为:330000 江西省南昌市赣江新区直管区万和路988号万创科技城1栋4层407室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励