中电信人工智能科技(北京)有限公司张国琛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信人工智能科技(北京)有限公司申请的专利语音情感的识别方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119832939B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411834783.3,技术领域涉及:G10L25/63;该发明授权语音情感的识别方法、装置、电子设备及存储介质是由张国琛设计研发完成,并于2024-12-12向国家知识产权局提交的专利申请。
本语音情感的识别方法、装置、电子设备及存储介质在说明书摘要公布了:本发明实施例提供了一种语音情感的识别方法、装置、电子设备及存储介质,涉及数据处理技术领域,所述方法包括:获取目标语音数据,以及用于语音情感识别的情感识别模型,情感识别模型至少包括特征提取模型、特征降维模型以及分类器;将目标语音数据输入特征提取模型进行特征提取,获得目标语音数据对应的语音特征;将语音特征输入特征降维模型进行特征降维,获得语音特征对应的低维特征;将低维特征输入分类器进行预测,获得语音数据的情感类别,从而通过对语音数据进行特征提取、特征降维以及分类等处理,有效地提高了语音情感的识别准确性。
本发明授权语音情感的识别方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种语音情感的识别方法,其特征在于,包括: 获取目标语音数据,以及用于语音情感识别的情感识别模型,所述情感识别模型至少包括特征提取模型、特征降维模型以及分类器,所述特征提取模型为基于动态群体进化优化的神经网络算法训练得到的模型,所述特征降维模型为基于特征细化的特征降维模型训练得到的模型,所述分类器为基于量子熵编码的随机森林分类器训练得到的分类器; 将所述目标语音数据输入所述特征提取模型进行特征提取,获得所述目标语音数据对应的语音特征; 将所述语音特征输入所述特征降维模型进行特征降维,获得所述语音特征对应的低维特征; 将所述低维特征输入所述分类器进行预测,获得所述语音数据的情感类别; 其中,所述方法还包括: 获取待训练的数据扩充模型,所述数据扩充模型至少包括生成器以及判别器,所述数据扩充模型中配置有对称破缺激励项; 确定用于对所述数据扩充模型进行训练的第一目标语音数据; 随机生成所述生成器对应的第一网络参数; 随机生成所述判别器对应的第二网络参数; 采用所述第一目标语音数据、所述第一网络参数与所述第二网络参数对所述生成器和所述判别器交替进行训练,获得所述生成器对应的生成器损失函数、以及所述判别器对应的判别器损失函数; 采用所述生成器损失函数与所述对称破缺激励项对所述生成器的参数进行迭代,直至满足预设的停止迭代条件,获得目标生成器; 采用所述判别器损失函数对所述判别器的参数进行迭代,直至满足预设的停止迭代条件,获得目标判别器; 将所述目标生成器与所述目标判别器进行组合,获得数据扩充模型; 其中,所述采用所述生成器损失函数与所述对称破缺激励项对所述生成器的参数进行迭代,直至满足预设的停止迭代条件,获得目标生成器,包括: 通过公式3计算所述对称破缺激励项: Δc=λc·||Gczc-xc||2-γc公式3 通过公式4对所述生成器的参数进行更新: 其中,Δc表示所述对称破缺激励项;Gc为生成器函数;zc为从先验分布中采样得到的随机噪声;xc为真实数据;Ωc为梯度调节函数;λc是对称破缺激励调整系数;γc是预设的对称破缺阈值;||Gczc-xc||2是生成数据和真实数据之间的欧式距离;||||2为L2范数,同欧式距离计算;为所述生成器损失函数;是生成对抗网络的学习率;表示对的梯度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信人工智能科技(北京)有限公司,其通讯地址为:100034 北京市西城区西四北大街156、158、160号2幢1至2层2-6、2-9内01;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励