四川大学彭德中获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于统一生成模型的知识驱动对话方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115952265B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211633699.6,技术领域涉及:G06F16/3329;该发明授权一种基于统一生成模型的知识驱动对话方法是由彭德中;张蔚琪;王骞;孙元设计研发完成,并于2022-12-19向国家知识产权局提交的专利申请。
本一种基于统一生成模型的知识驱动对话方法在说明书摘要公布了:本发明公开了一种基于统一生成模型的知识驱动对话方法,属于自然语言处理技术领域,通过数据格式化模块将输入数据字段统一格式,得到数据格式化模块的实体预测模式、属性预测模式和对话生成模式;获取混合训练集;基于混合训练集和负对数似然损失函数训练并得到统一生成模型;利用数据格式化模块、统一生成模型和知识库对待测试的历史对话选择外部知识,并对待测试的历史对话进行预测回复;本发明通过将知识驱动对话系统中复杂众多的流程简化并合并成实体预测、属性预测和对话生成三个关键任务,统一改造成文本生成问题,使用统一的生成模型进行多任务建模,解决了现有知识驱动对话模型众多、实现复杂、显存占用大和推理耗时长的问题。
本发明授权一种基于统一生成模型的知识驱动对话方法在权利要求书中公布了:1.一种基于统一生成模型的知识驱动对话方法,其特征在于,包括如下步骤: S1、通过数据格式化模块将输入数据字段统一格式,得到数据格式化模块的实体预测模式、属性预测模式和对话生成模式; S2、基于知识驱动对话数据集Kdconv以及数据格式化模块的实体预测模式、属性预测模式和对话生成模式,得到由实体预测训练集、属性预测训练集和对话生成训练集构成的混合训练集,具体为: S21、获取由对话数据集KdConv conv和外部知识库KdConv kg构成的知识驱动对话数据集Kdconv,并将初始实体预测训练集、初始属性预测训练集和初始对话生成训练集均设置为空列表; S22、逐一循环遍历对话数据集KdConv conv中的任一对话样本中的第i个句子,并将该句子作为第i个回复,并将其对应对话样本中在其前面的句子作为第i段历史对话,其中,,表示对话样本中的句子总数; S23、获取第i个回复对应的第i个三元组列表Kg_ls i中的所有实体,构建对应的第i个实体集Entity_set i,针对第i个三元组列表Kg_ls i不为空列表时,第i个实体集Entity_set i由第i个三元组列表Kg_ls i中的所有实体构成,否则将第i个实体集Entity_ set i统一设置为空实体集,其中,空实体集内仅包括空字符‘无’; S24、将第i段历史对话和第i个实体集Entity_set i作为输入数据字段,并利用数据格式化模块的实体预测模式,得到第i个实体预测结果,且将第i个实体预测结果加入初始实体预测训练集,其中,表示第i个实体编码文本,表示第i个实体解码文本; S25、针对第i个实体集Entity_set i为非空集合时,则从第i个三元组列表Kg_ls i中获取第i个实体集Entity_set i中任一实体实际使用的属性集,从外部知识库KdConv kg中获取该实体的所有属性All_attr j,其中,,表示第i个实体集Entity_set i中的实体总数; S26、将第i段历史对话、第i个实体集Entity_set i中任一实体、该实体的所有属性All_attr j和实际使用的属性集作为输入数据字段,并利用数据格式化模块的属性预测模式,得到第j个属性预测结果,且将第j个属性预测结果加入初始属性预测训练集,其中,表示第j个属性编码文本,表示第j个属性解码文本; S27、将第i段历史对话、第i个三元组列表Kg_ls i和第i个回复作为输入数据字段,并利用数据格式化模块的对话生成模式,得到第i个对话生成结果,且将第i个对话生成结果加入初始对话生成训练集,其中,表示第i个对话编码文本,表示第i个对话解码文本; S28、重复步骤S22至步骤S27,直至对话数据集KdConv conv中的所有对话样本均被循环遍历完,得到完整的实体预测训练集、属性预测训练集和对话生成训练集; S29、将实体预测训练集、属性预测训练集和对话生成训练集混合,得到混合训练集,其中,混合训练集内的各训练样本均为(编码端文本,解码端文本)的格式; S3、基于混合训练集和负对数似然损失函数训练并得到统一生成模型; S4、利用数据格式化模块、统一生成模型和知识库对待测试的历史对话选择外部知识,并对待测试的历史对话进行预测回复。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610044 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。