福州大学廖祥文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉福州大学申请的专利一种基于双路编码器的可解释性文本分类系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115828142B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211628528.4,技术领域涉及:G06F18/24;该发明授权一种基于双路编码器的可解释性文本分类系统是由廖祥文;徐攀;林于翔;沈鸿骁;姚孟韬设计研发完成,并于2022-12-17向国家知识产权局提交的专利申请。
本一种基于双路编码器的可解释性文本分类系统在说明书摘要公布了:本发明提供一种基于双路编码器的可解释性文本分类系统,包括:包含一个预处理模块,用于对文本进行特征化处理;包含一个编码器模块,用于获取文本不同角度上的语义信息;包含一个分类器模块,用于输出文本分类结果;包含一个解释性信息生成器模块,用于输出文本分类结果的文本解释。应用本技术方案能够通过融合多头注意力与双向门控循环单元的语义表示,学习文本的多层次的语义信息,并使用二次注意力机制,解决查询和注意力结果不匹配问题,对编码的语义信息进行增强,从而较好地实现可解释性文本分类。
本发明授权一种基于双路编码器的可解释性文本分类系统在权利要求书中公布了:1.一种基于双路编码器的可解释性文本分类系统,其特征在于,包括: 一个预处理模块,用于对文本进行特征化处理; 一个编码器模块,用于获取文本不同角度上的语义信息; 一个分类器模块,用于输出文本分类结果; 一个解释性信息生成器模块,用于输出文本分类结果的文本解释; 解释性信息生成器模块使用条件变分自动编码器CVAE生成文本型解释性信息,解释性信息生成器模块由解释信息编码器、后验网络、先验网络、解码器以及隐变量监督模块五个部分组成;其中编码器、解码器使用基于多头注意力的transformer编码器,后验网络和先验网络均使用多层感知机,隐变量监督模块是一个三层全连接网络后接softmax函数的分类器;在训练过程中,解释性信息生成器模块以解释性信息、原文本的向量表示ve以及文本分类结果的向量表示vc作为输入; 条件变分自动编码器CVAE在训练时需要最大化在只给定文本信息和文本分类结果信息[ve;vc]的条件下,vc对应文本分类结果的文本解释信息x的条件似然变分下界,具体公式如下所示: 其中z为隐变量,c=[ve;vc]; 编码器对解释信息的嵌入表示进行编码后,映射为向量表示x,用于估计px|z,c,记为pDx|z,c;先验网络以ve和vc的拼接为输入,拟合潜在变量z'在未知目标文本条件下的先验概率分布pz|c,记为PPZ∣C;通过最大化先验概率分布的变分下界来训练先验网络向后验网络进行逼近,输出更好的隐变量z';后验网络以向量x、ve和vc的拼接为输入,拟合隐变量z在已知目标文本条件下的后验概率分布qRz|x,c,该分布估计真实的后验概率分布;logpx|c的变分下界如下所示: 其中θ为网络参数; 解码器使用从后验分布qRz|x,c中采样获得的隐变量z初始化隐藏状态,以ve和目标文本嵌入表示x作为输入,输出每个时间步的单词概率分布,并通过优化与实际目标评论摘要的交叉熵损失来进行训练;引入隐变量监督模块,通过隐变量z对文本进行分类,如果得到正确的分类说明隐变量z编码足够的源端信息,生成解释信息;由此可得,CVAE中关于识别网络与先验网络的损失函数为: 其中LZ为通过隐变量z对文本的分类损失; 在测试过程中,生成器模块以文本的向量表示ve以及文本分类结果向量表示vc作为输入;[ve;vc]输入先验网络后,从先验分布中采样获得隐变量z',解码器使用该隐变量z'与目标解释信息嵌入表示进行相加,逐时间步输出目标单词,生成最终解释性信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福州大学,其通讯地址为:350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。