厦门市美亚柏科信息安全研究所有限公司张宇含获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门市美亚柏科信息安全研究所有限公司申请的专利一种基于扩散对齐的大模型检索增强生成方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119988596B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411819577.5,技术领域涉及:G06F16/335;该发明授权一种基于扩散对齐的大模型检索增强生成方法和系统是由张宇含;周成祖;谭杰;任伟;赵文霞;赵建强;陈思萌;陈子沣设计研发完成,并于2024-12-11向国家知识产权局提交的专利申请。
本一种基于扩散对齐的大模型检索增强生成方法和系统在说明书摘要公布了:公开了一种基于扩散对齐的大模型检索增强生成方法和系统,包括获取用户输入的文本信息,并采用向量模型对文本信息进行编码,得到编码后的语义向量;从向量数据库中检索与编码语义向量相似的文本信息,并根据相似度阈值选择符合条件的文本信息;对符合条件的文本信息进行实体抽取,将提取的实体信息与图数据库中存储的实体关系进行索引,生成包含额外语义信息的增强背景信息;将增强背景信息从原始词向量空间扩散到大语言模型的词向量空间,得到与语言模型语义分布一致的扩散偏移向量;将扩散偏移向量与用户输入文本信息的编码向量进行拼接,输入大语言模型进行推理,输出包含检索增强信息的生成结果。本申请可大幅提高推理速度。
本发明授权一种基于扩散对齐的大模型检索增强生成方法和系统在权利要求书中公布了:1.一种基于扩散对齐的大模型检索增强生成方法,其特征在于,包括: S1:获取用户的提问文本信息,采用向量模型对其进行编码得到语义向量,将所述语义向量与从向量数据库中依次获取的向量进行余弦相似度计算,抽取相似度符合阈值的文本信息和向量信息; S2:对所述文本信息进行实体抽取,定义实体信息类别并使其与图数据库中的定义一致,得到实体序列,将抽取的所述实体信息在所述图数据库中索引,根据实体和实体关系得到额外语义信息与对应的编码向量,将所述编码向量作为已知信息得到实体增强的图数据库信息,再将所述图数据库信息与向量数据库中的信息合并得到最终背景向量信息; S3:将所述最终背景向量信息从原始的BGE词向量空间扩散到语言模型的词向量空间,引入预设参数并计算得到扩散偏移向量; S4:将所述扩散偏移向量和更新后的向量继续输入语义扩散结构,重复所述S3得到信息扩散偏移向量,用所述扩散偏移向量与所述信息扩散偏移向量逐位相减得到消除伪语义噪声的语义向量,循环至步数达到预设值得到最终的扩散偏移向量; S5:将所述用户的提问文本信息采用与语言模型一致的模型进行文本编码得到向量形式,将所述扩散偏移向量与所述向量形式进行拼接,得到包含所述用户的提问文本信息和召回信息编码信息的三维语义向量,输入大语言模型推理得到最终输出结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门市美亚柏科信息安全研究所有限公司,其通讯地址为:361000 福建省厦门市思明区软件园观日路14号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励