恭喜腾讯音乐娱乐科技(深圳)有限公司谭志力获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯音乐娱乐科技(深圳)有限公司申请的专利音色识别模型训练方法及相关组件、音色识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116013267B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211667038.5,技术领域涉及:G10L15/06;该发明授权音色识别模型训练方法及相关组件、音色识别方法是由谭志力设计研发完成,并于2022-12-22向国家知识产权局提交的专利申请。
本音色识别模型训练方法及相关组件、音色识别方法在说明书摘要公布了:本申请公开了一种音色识别模型训练方法及相关组件、音色识别方法,包括:利用待训练音色识别模型的生成器网络对音频样本一和音频样本二进行特征提取,得到音色嵌入特征一和音色嵌入特征二;利用判别器模型对音色嵌入特征一和音色嵌入特征二进行场景判断,利用判别器损失函数对判别器模型进行对抗训练;利用生成器损失函数对生成器网络进行对抗训练;利用音色嵌入特征一和音色嵌入特征二对分类器网络进行训练,得到目标音色识别模型。通过对抗训练的方式对待训练音色模型中的生成器网络进行训练同时训练分类器模型,训练后的目标音色识别模型能够将同一主体在不同场景下的音频对应的主体身份均识别为该主体。
本发明授权音色识别模型训练方法及相关组件、音色识别方法在权利要求书中公布了:1.一种音色识别模型训练方法,其特征在于,包括:将音频样本一和音频样本二输入待训练音色识别模型,以利用所述待训练音色识别模型的生成器网络对输入的所述音频样本一和所述音频样本二进行特征提取,得到音色嵌入特征一和音色嵌入特征二;所述音频样本一和所述音频样本二分别属于不同的场景;将所述音色嵌入特征一和所述音色嵌入特征二输入判别器模型,以利用所述判别器模型对所述音色嵌入特征一和所述音色嵌入特征二进行场景判断,并利用判别器损失函数对所述判别器模型进行对抗训练,直至所述判别器模型将所述音色嵌入特征一和所述音色嵌入特征二判断为相同场景;根据判别器损失函数的损失值进行反向传播,并利用生成器损失函数对所述生成器网络进行对抗训练,直至所述生成器网络收敛;利用所述音色嵌入特征一和所述音色嵌入特征二对所述待训练音色识别模型中的分类器网络进行训练,直至所述分类器网络收敛,得到至少包括训练后的所述生成器网络和训练后的所述分类器网络的目标音色识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯音乐娱乐科技(深圳)有限公司,其通讯地址为:518052 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。