成都华栖云科技有限公司蒋文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都华栖云科技有限公司申请的专利文本意图重构方法、装置、设备、存储介质及计算机产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120256589B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510727398.7,技术领域涉及:G06F16/3329;该发明授权文本意图重构方法、装置、设备、存储介质及计算机产品是由蒋文;张亚敏;赵永生;颜涛;丁海洋;姜铼;袁官锐;刘传真设计研发完成,并于2025-06-03向国家知识产权局提交的专利申请。
本文本意图重构方法、装置、设备、存储介质及计算机产品在说明书摘要公布了:本申请公开了一种文本意图重构方法、装置、设备、存储介质及计算机产品,涉及自然语言处理技术领域,方法包括:获取意图重构样本集合;意图重构样本集合包括输入样本数据和输出样本数据;其中,输出样本数据携带语义标志位;基于意图重构样本集合和训练目标损失函数对预训练模型进行指令监督微调,获得文本意图重构模型;其中训练目标损失函数的损失权重基于语义标志位的分布情况确定;将待重构文本输入至文本意图重构模型,获得文本意图重构结果。本申请利用基于语义标志位损失函数更新策略,提升了文本意图重构的质量,实现了文本意图重构模型的高效训练、稳健泛化与响应质量的显著提升。
本发明授权文本意图重构方法、装置、设备、存储介质及计算机产品在权利要求书中公布了:1.一种文本意图重构方法,其特征在于,所述的方法包括: 获取意图重构样本集合;所述意图重构样本集合包括输入样本数据和输出样本数据;其中,所述输出样本数据携带语义标志位; 基于所述意图重构样本集合和训练目标损失函数对预训练模型进行指令监督微调,获得文本意图重构模型;其中所述训练目标损失函数的损失权重基于所述语义标志位的分布情况确定; 将待重构文本输入至所述文本意图重构模型,获得文本意图重构结果; 所述输入样本数据包括询问问题信息、历史对话信息和提示词,所述输出样本数据包括问题改写信息、问题意图信息和语义相似性标志位;所述语义相似性标志位基于所述历史对话信息和所述询问问题信息的相关程度确定,所述问题改写信息携带意图重构标志位; 所述基于所述意图重构样本集合和训练目标损失函数对预训练模型进行指令监督微调,获得文本意图重构模型的步骤包括: 对意图重构样本进行分词处理,获得样本词序列; 调用所述预训练模型对样本词序列进行预测,获得词序列预测结果; 基于所述训练目标损失函数,确定意图重构样本和所述词序列预测结果之间的差异,获得模型损失;所述训练目标损失函数的损失权重基于所述语义相似性标志位和所述意图重构标志位的分布情况更新; 基于所述模型损失对所述预训练模型进行指令监督微调,获得所述文本意图重构模型; 所述基于所述训练目标损失函数,确定意图重构样本和所述词序列预测结果之间的差异,获得模型损失的步骤包括: 获取预设损失权重配置信息; 基于预设损失权重配置信息,确定意图重构标志位和语义相似性标志位所对应的样本词序列的损失权重; 基于意图重构标志位和语义相似性标志位所对应样本词序列的损失权重,更新训练目标损失函数; 基于训练目标损失函数,确定意图重构样本和样本预测结果之间的差异,获得模型损失; 所述模型损失的具体计算公式为: 其中,其中为第t个目标token,为模型对该token的预测概率,为该token对应的权重系数;T为输出序列中有效token的总数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都华栖云科技有限公司,其通讯地址为:610000 四川省成都市高新区天府五街200号菁蓉汇4号楼A区9楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。