太原理工大学段淑斐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉太原理工大学申请的专利基于Bi-MGAN和ResTCN-FDA网络的语音情感识别系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115631769B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211094361.8,技术领域涉及:G10L25/63;该发明授权基于Bi-MGAN和ResTCN-FDA网络的语音情感识别系统和方法是由段淑斐;张雪英;李海烽;孙颖;贾海蓉;朱婷设计研发完成,并于2022-09-08向国家知识产权局提交的专利申请。
本基于Bi-MGAN和ResTCN-FDA网络的语音情感识别系统和方法在说明书摘要公布了:本发明属于语音信号处理领域,具体涉及一种基于Bi‑MGAN和ResTCN‑FDA网络的语音情感识别方法和系统。包括Bi‑MGAN网络和ResTCN‑FDA网络和softmax模块,Bi‑MGAN网络包括正向生成器、反向生成器、发音学判别器和声学判别器,正向生成器用于映射出发音学特征的声学特征,反向生成器用于映射出声学特征的发音学特征,发音学判别器用于对真实的发音学特征和映射的发音学特征进行比较,并利用损失函数回调正向向生成器的权重参数;声学判断器用于对真实的声学特征和映射的声学进行比较,并利用损失函数回调反向生成器的权重参数;ResTCN‑FDA网络包括ResTCN网络、FA模块、DA模块,softmax模块用于根据DA模块的输出计算得到对应的情感分类。本发明可以提高语音情感识别率。
本发明授权基于Bi-MGAN和ResTCN-FDA网络的语音情感识别系统和方法在权利要求书中公布了:1.一种基于Bi-MGAN和ResTCN-FDA网络的语音情感识别系统,其特征在于,包括Bi-MGAN网络和ResTCN-FDA网络和softmax模块,所述Bi-MGAN网络包括正向生成器、反向生成器、发音学判别器、声学判别器和损失函数计算模块; 所述正向生成器用于映射出发音学特征的声学特征,反向生成器用于映射出声学特征的发音学特征,所述声学判断器用于对真实的声学特征和映射的声学进行比较得到第一对抗性损失函数,所述发音学判别器用于对真实的发音学特征和映射的发音学特征进行比较得到第二对抗性损失函数; 所述损失计算模块用于根据原始发音学特征、映射发音学特征及第一对抗性损失函数来计算正向整体损失函数,以及根据原始声学特征、映射声学特征及第二对抗性整体损失函数来计算反向整体损失函数;所述正向整体损失函数用于回调正向生成器的权重参数;所述反向整体损失函数用于回调反向生成器的权重参数; 所述ResTCN-FDA网络包括ResTCN网络、FA模块、DA模块,所述正向生成器映射出的声学特征和对应的发音学特征进行特征融合后,输出到所述ResTCN-FDA网络,所述反向生成器映射出的发音学特征和对应的声学特征进行特征融合后输出到经所述ResTCN-FDA网络,所述ResTCN网络用于对输入的融合特征进行处理,所述FA模块用于对处理后的融合特征进行特征注意力处理后得到特征注意力权重系数,并应用特征注意力权重对ResTCN网络输出的融合特征进行权重处理后输出,所述DA模块用于对FA模块输出的特征进行维度注意力处理后得到维度注意力权重系数,并应用维度注意力权重系数对FA模块输出的特征进行权重处理后输出至softmax模块; 所述Softmax模块用于根据DA模块的输出计算得到对应的情感分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人太原理工大学,其通讯地址为:030024 山西省太原市迎泽西大街79号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励