浙江大学张寅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于反事实数据增强和多视角思维链的大模型知识蒸馏方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119721182B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411594814.2,技术领域涉及:G06N3/096;该发明授权基于反事实数据增强和多视角思维链的大模型知识蒸馏方法是由张寅;冯韬设计研发完成,并于2024-11-10向国家知识产权局提交的专利申请。
本基于反事实数据增强和多视角思维链的大模型知识蒸馏方法在说明书摘要公布了:本发明公开了一种基于反事实数据增强和多视角思维链的大模型知识蒸馏方法。本发明首先利用主题词和语法分析树获取文本语义的关键特征,并用大语言模型自动的生成高质量反事实数据,然后利用多视角思维链增强反事实数据的多样性,提升小语言模型的推理能力。和现有技术相比,本发明提出的大模型反事实蒸馏框架能够增强小模型推理的鲁棒性和泛化能力,在不同架构的小语言模型和不同分布的数据集上都取得了优异的性能。
本发明授权基于反事实数据增强和多视角思维链的大模型知识蒸馏方法在权利要求书中公布了:1.一种基于反事实数据增强和多视角思维链的大模型知识蒸馏方法,其特征在于,包括以下步骤: S1:将由问题、选项和答案构成的问答文本输入大语言模型中,并结合大语言模型和句法分析从问题文本中识别与因果特征相关的短语; S2:将问题文本中与因果特征相关的短语替换为遮掩字符,同时修改作为任务标签的答案,然后通过带示例的提示驱动大语言模型基于修改后的答案补全所述问题文本中的所有遮掩字符,从而生成与原始问答文本高度相似但任务标签被修改的新问答文本,作为反事实示例; S3:针对不同的问答文本,不断重复S1~S2,获得由一系列反事实示例组成的待筛选数据集;利用大语言模型的自一致性对待筛选数据集进行过滤,待筛选数据集中的每个反事实示例均由大语言模型生成指定条数的推理路径,将推理结果与实际任务标签一致的路径比例不低于阈值的反事实示例保留于新数据集中,其余反事实示例剔除; S4:针对新数据集中的每个问答文本,通过大语言模型为每个问答文本生成多视角思维链,所述多视角思维链包括针对正确答案选项的正向思维链以及针对每个非正确答案选项的负向思维链;最终将问答文本中扩充有多视角思维链的新数据集作为大语言模型知识蒸馏结果,用于训练小语言模型; 所述S1中,从问题文本中识别与因果特征相关的短语的方法如下: S11:通过提示驱动大语言模型利用其上下文学习能力,获取问题文本中的主题词; S12:利用句法分析工具获取问题文本中的所有名词短语,并对去除其中的人称代词和物主代词,将剩余保留的名词短语与所述主题词一起作为与因果特征相关的短语; 所述S2中,作为任务标签的答案被修改为原始问答文本的选项中除了正确答案选项之外的其他任一选项; 所述S2中,带示例的提示包含示例和指令,其中示例由一个示例性的问题文本、选项、预期答案以及问题补全结果组成,其中问题文本中与因果特征相关的短语预先被替换为遮掩字符;所述指令为输入大语言模型的任务介绍,用于提示大语言模型在给定选项的上下文中对遮掩字符进行补全,使补全后的问题文本在给定选项中对应的正确答案与预期答案一致; 所述S3中,利用大语言模型的自一致性对待筛选数据集进行过滤,生成新数据集的方法如下: 针对待筛选数据集中的每个反事实示例,将对应的新问答文本中的问题和选项输入大语言模型中,由大语言模型重复进行多轮次推理,大语言模型的每次推理均会通过生成一条推理路径进而从所述选项中选出答案选项,判断每次推理结果中所选择的答案选项是否与这个新问答文本中的任务标签一致;若所有推理轮次的一致率不低于预设的阈值,则将这个反事实示例保留于新数据集中,否则将这个反事实示例剔除。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励