浙江大学张寅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于大语言模型的迭代式多跳问答方法、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119311794B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411120308.X,技术领域涉及:G06F16/332;该发明授权基于大语言模型的迭代式多跳问答方法、介质及设备是由张寅;郑晓燕设计研发完成,并于2024-08-15向国家知识产权局提交的专利申请。
本基于大语言模型的迭代式多跳问答方法、介质及设备在说明书摘要公布了:本发明公开了一种基于大语言模型的迭代式多跳问答方法、介质及设备,方法包括如下步骤:大语言模型将待求解的多跳问题分解为多个子问题,通过特定的标识符指示子问题间的依赖关系;对于分解结果中的原子问题,结合信息检索模型提取相似段落,输入大语言模型以求得答案;基于已得到答案的原子问题及答案进行问题重构,若问题重构结果为一个仍需求解的问题,则将其作为下一轮迭代的起点,不断重复迭代,直至获得最终答案;对同一个待求解的多跳问题,生成多条查询链后,采用含可训练模块的评分机制从中选出最优方案作为最终问答结果。和现有技术相比,本发明通过迭代式地分解和重构问题,结合精化的查询链选择机制,显著提升了多跳问答的准确性。
本发明授权基于大语言模型的迭代式多跳问答方法、介质及设备在权利要求书中公布了:1.一种基于大语言模型的迭代式多跳问答方法,其特征在于,包括以下步骤: S1:获取待求解的多跳问题,不断迭代对待求解的多跳问题进行求解,在当前迭代轮次内,将上个迭代轮次得到的待分解问题、与待分解问题相似的问题分解示例以及描述任务的提示词共同输入大语言模型,利用大语言模型的上下文学习能力将待分解问题分解,得到当前迭代轮次待分解问题的分解结果;描述任务的提示词中通过标识符表示分解结果中非独立问题指向各个原子问题的依赖关系,每个标识符表示每个原子问题的答案; S2:将分解结果中的各个原子问题分别作为待求解原子问题,利用信息检索模型提取与待求解原子问题相似的段落作为相似段落,将待求解原子问题和相似段落共同输入所述大语言模型,并通过问题求解的提示词指导大语言模型输出待求解原子问题的答案; S3:将分解结果中得到答案的原子问题分别与各自对应的答案组成原子问题-答案对,将得到的原子问题-答案对与上个迭代轮次得到的待分解问题共同输入大语言模型,并通过问题重构的提示词指导大语言模型进行问题重构,得到问题重构结果;若问题重构结果表示没有任何问题需要解决,则输出答案并作为待求解的多跳问题的最终答案;若问题重构结果为一个仍需求解的问题,则将其作为下个迭代轮次的待分解问题,不断重复迭代,直至获得待求解的多跳问题的最终答案; S4:对同一个待求解的多跳问题进行多次求解以获取多个最终答案,由用于生成同一个最终答案的原子问题构成一条查询链,得到全部的查询链后,使用含可训练模块的评分机制从所有查询链中选出最终评分最高的查询链作为最优查询链,与最优查询链对应的最终答案作为待求解的多跳问题的最终问答结果; 步骤S4中,由含可训练模块的评分机制从所有查询链中选出最终评分最高的查询链的具体过程如下: S41:将一条查询链中的一个原子问题作为待评分的原子问题,通过信息检索模型计算待评分的原子问题与参考文档中各段落的相似度分数,并对得到的相似度分数进行排序,从相似度分数的排序结果中选择前K个最高的相似度分数作为预先训练好的可训练模块的输入,由所述可训练模块预测段落排名阈值,在参考文档中将段落排名阈值之前的所有段落作为参与计算段落; S42:对待评分的原子问题,取参与计算段落的相似度分数均值作为其与参考文档的对齐度得分; S43:对任一查询链,将同一条查询链中得到的对齐度得分均值作为对应查询链的最终评分,最后将最终评分最高的查询链作为最优查询链; 所述可训练模块采用多层感知器,在可训练模块的训练过程中,在训练集上训练所述可训练模块,所述训练集中的一个训练样本由一个原子问题和对应的参考文档组成,将每个训练样本的参考文档中包含原子问题答案的段落作为证据段落,将每个训练样本的参考文档中排在证据段落之前的段落标记为正例,而排在证据段落之后的段落标记为负例,正例对应的标签序列为1,负例对应的标签序列为0;由信息检索模型计算每个训练样本中原子问题与各自参考文档中每个段落的相似度分数,将每个段落的相似度分数排名作为检索结果;对于每个训练样本中原子问题,将各自参考文档中相似度分数最高的前K个相似度分数拼接后作为可训练模块的输入,得到概率分数列表,通过Sigmoid激活函数对概率分数列表进行归一化,得到归一化的概率分数列表,其中,概率分数列表中的一个值表示将参考文档中相似度分数最高的一个段落标记为正例的概率;将归一化的概率分数列表映射后,得到证据段落的预测索引,计算证据段落的预测索引和证据段落的真实索引之间的均方误差损失,计算归一化的概率分数列表和标签序列之间的二元分类损失,将均方误差损失和二元分类损失相加作为总损失,最小化所述总损失更新所述可训练模块参数,直至收敛。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励