江汉大学朱国华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江汉大学申请的专利基于UniLM模型和Copy机制的中文共情语句训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116150334B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211591710.7,技术领域涉及:G06F16/3329;该发明授权基于UniLM模型和Copy机制的中文共情语句训练方法及系统是由朱国华;姚盛根;胡晓莉设计研发完成,并于2022-12-12向国家知识产权局提交的专利申请。
本基于UniLM模型和Copy机制的中文共情语句训练方法及系统在说明书摘要公布了:本发明属于面向中文的自然语言生成技术领域,提出了一种基于UniLM模型和Copy机制的中文共情语句训练方法及系统,针对共情回复和用户输入的上下文相关性不足、以及回复中包含情绪关键词和复杂事件细节的特殊性,使用Copy机制使输出能从输入中复制情绪关键词和复杂事件细节。同时,针对缺乏足量的、多样性的训练语料,对生成的共情回复进行综合评价,将符合预期标准的优质共情回复以及用户输入放入原始训练语料进行复式自动迭代训练,增强训练数据。本发明使提出在解码器中融合Copy机制,将情绪关键词和复杂事件细节复制到输出中来解决。针对中文心里对话具有共情能力的语料匮乏的问题,本发明采用复式自动迭代训练来增强训练数据。
本发明授权基于UniLM模型和Copy机制的中文共情语句训练方法及系统在权利要求书中公布了:1.一种基于UniLM模型和Copy机制的中文共情回复生成方法,其特征在于,将源序列中的情绪关键词和复杂事件细节复制到输出中;使用困惑度评价标准对输出的共情回复进行评价,将符合预期的回复和用户陈述放入原始训练语料中进行复式自动迭代训练,得到进一步更新优化的共情回复生成模型; 具体包括如下步骤: 步骤1,使用爬虫技术爬取心理对话领域具有共情能力的语料,并进行预处理,得到输入表示; 步骤2,基于UniLM模型进行预训练,同时使用三种类型的语言模型,每种语言模型使用不同的自注意力掩码机制; 步骤3,利用交叉熵损失函数计算损失,完成基于UniLM模型的预训练,得到共情回复生成模型; 步骤4,基于UniLM模型进行共情回复生成任务,通过序列到序列语言模型的自注意力机制解码,得到词表概率分布; 步骤5,在步骤4基础上构建包含Copy机制的解码器,引入生成概率和复制概率,优化步骤4中的词表概率分布; 步骤6,将交叉熵损失函数作为模型的损失函数,利用BeamSearch算法得到生成的共情回复; 步骤7,将生成的优质共情回复和用户的陈述放入步骤1的语料中,进一步基于UniLM模型进行复式自动迭代训练,得到更新优化后的共情回复生成模型; 步骤2具体包括:以BERT-BASE预训练模型初始化参数;基于同一Transformer网络结构,以预测不同的MASK作为预训练目标,完成单向、双向以及序列到序列语言模型的预测任务,并均匀分配使用不同语言模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江汉大学,其通讯地址为:430056 湖北省武汉市经济技术开发区三角湖路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励