腾讯音乐娱乐科技(深圳)有限公司徐东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯音乐娱乐科技(深圳)有限公司申请的专利语音合成模型训练方法、语音合成方法、设备及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114566140B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210157576.3,技术领域涉及:G10L13/02;该发明授权语音合成模型训练方法、语音合成方法、设备及产品是由徐东设计研发完成,并于2022-02-21向国家知识产权局提交的专利申请。
本语音合成模型训练方法、语音合成方法、设备及产品在说明书摘要公布了:本申请涉及一种语音合成模型的训练方法、语音合成方法、设备和产品。所述语音合成模型的训练方法包括:获取训练语音对象的训练语音样本所对应的训练语谱信息;将训练语谱信息输入到待训练的语音合成模型中的第一编码模块,通过第一编码模块编码得到训练语谱信息对应的第一编码向量,确定第一编码向量对应的训练向量分布参数;基于训练向量分布参数得到训练语音对象对应的训练对象音色特征,根据训练对象音色特征和训练语音样本对应的训练文本信息得到第一合成语音;根据第一合成语音与训练语音样本之间的差异,得到第一模型损失值;根据第一模型损失值调整模型参数,得到预训练的语音合成模型,能有效提高合成语音对应音色与说话人音色的相似度。
本发明授权语音合成模型训练方法、语音合成方法、设备及产品在权利要求书中公布了:1.一种语音合成模型的训练方法,其特征在于,所述方法包括: 获取多个训练语音对象的训练语音样本各自对应的训练语谱信息; 将多个所述训练语谱信息输入到待训练的语音合成模型中的第一编码模块,通过所述第一编码模块编码得到所述训练语谱信息对应的第一编码向量,确定所述第一编码向量对应的训练向量分布参数; 基于所述训练向量分布参数生成所述训练语音对象对应的训练对象音色特征,根据所述训练对象音色特征和所述训练语音样本对应的训练文本信息得到第一合成语音; 根据所述第一合成语音与所述训练语音样本之间的差异,得到第一模型损失值; 根据所述第一模型损失值调整所述待训练的语音合成模型的模型参数,得到预训练的语音合成模型;所述预训练的语音合成模型包括多个所述训练语谱信息各自对应的训练向量分布参数,当获取到与各个所述训练语音对象不同的目标语音对象的目标语谱信息时,所述目标语音对象对应的目标语音合成模型,根据第二模型损失值对所述预训练的语音合成模型调整得到,所述第二模型损失值根据第二合成语音与所述目标语音对象提供的目标语音样本的差异确定,所述第二合成语音根据目标对象音色特征和所述目标语音样本的目标文本信息生成,所述目标对象音色特征基于所述预训练的语音合成模型中目标训练语音对象的训练向量分布参数的调整结果确定;所述目标训练语音对象的音色与所述目标语音对象的音色相匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯音乐娱乐科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励