平安科技(深圳)有限公司孙奥兰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利语音转换模型训练方法、语音转换方法、装置及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115171666B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210897502.3,技术领域涉及:G10L15/02;该发明授权语音转换模型训练方法、语音转换方法、装置及介质是由孙奥兰;王健宗设计研发完成,并于2022-07-28向国家知识产权局提交的专利申请。
本语音转换模型训练方法、语音转换方法、装置及介质在说明书摘要公布了:本申请涉及语音转换技术领域,提供了一种语音转换模型训练方法、语音转换方法、装置及介质,方法部分包括:通过编码器从预设语音样本中提取语音样本特征。然后基于预设掩码策略对语音样本进行解耦,得到的样本特征表示,将样本特征表示输入至生成器,令生成器根据样本特征表示重建语音样本梅尔频谱图,得到目标样本梅尔频谱图,根据目标样本梅尔频谱图和预设语音样本对应的原始样本梅尔频谱图,计算语音转换模型的语音重构损失。基于对抗损失和语音重构损失优化语音转换模型中的参数,得到训练好的语音转换模型。通过预设掩码策略和预设对抗网络对语音样本特征进行解耦,提高了语音转换模型的鲁棒性,进而提高了训练效率。
本发明授权语音转换模型训练方法、语音转换方法、装置及介质在权利要求书中公布了:1.一种语音转换模型训练方法,其特征在于,所述语音转换模型训练方法包括: 通过编码器从预设语音样本中提取语音样本特征;所述语音样本特征包括样本内容特征、样本音色特征、样本节奏特征以及样本音高特征; 基于预设掩码策略和预设对抗网络对所述语音样本特征进行解耦,得到样本特征表示,并计算解耦过程中的对抗损失;所述样本特征表示用于表征增强后的语音样本特征; 将所述样本特征表示输入生成器,生成目标样本梅尔频谱图; 根据所述目标样本梅尔频谱图与所述预设语音样本对应的原始样本梅尔频谱图,计算语音重构损失; 基于所述对抗损失和所述语音重构损失优化所述语音转换模型中的参数,得到训练好的语音转换模型; 其中,所述预设对抗网络包括预测层和梯度反向层;所述基于预设掩码策略和预设对抗网络对所述语音样本特征进行解耦,得到样本特征表示,并计算解耦过程中的对抗损失,包括: 基于所述预设掩码策略生成随机掩码;所述随机掩码用于随机屏蔽所述样本内容特征、样本音色特征、样本节奏特征及样本音高特征中的一种样本特征,使得所述预测层基于除被屏蔽的样本特征外的其他三种样本特征,预测出所述被屏蔽的样本特征; 基于所述随机掩码和所述语音样本特征计算所述对抗损失; 基于所述梯度反向层和所述对抗损失,对所述语音样本特征进行解耦,得到样本特征表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励