腾讯音乐娱乐科技(深圳)有限公司谭志力获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉腾讯音乐娱乐科技(深圳)有限公司申请的专利模型训练方法、语音合成方法、设备和计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114333759B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111676481.4,技术领域涉及:G10L13/02;该发明授权模型训练方法、语音合成方法、设备和计算机程序产品是由谭志力设计研发完成,并于2021-12-31向国家知识产权局提交的专利申请。
本模型训练方法、语音合成方法、设备和计算机程序产品在说明书摘要公布了:本申请涉及智能语音领域,提供了一种模型训练方法、语音合成方法、设备和计算机程序产品。本申请能够提高文字音素转化模型的训练效率。该方法包括:从训练数据库中获取包含具有多种发音的目标文字的文本序列及该文本序列对应发音的音频素材,通过语音识别模型提取该音频素材对应的音素序列并将其作为音素序列标注结果,及将文本序列输入至待训练的文字音素转化模型得到其输出的音素序列预测结果,然后将该音素序列标注结果与音素序列预测结果进行比较获得音素序列预测偏差,根据该音素序列预测偏差调整待训练的文字音素转化模型参数,当满足训练完成条件时得到文字音素转化模型。
本发明授权模型训练方法、语音合成方法、设备和计算机程序产品在权利要求书中公布了:1.一种模型训练方法,其特征在于,所述方法包括: 从训练数据库中获取包含目标文字的文本序列及所述文本序列对应发音的音频素材; 所述目标文字为具有多种发音的文字; 通过语音识别模型提取所述音频素材对应的音素序列; 将所述文本序列输入至待训练的文字音素转化模型,得到所述待训练的文字音素转化模型输出的所述文本序列对应的音素序列预测结果; 将所述音素序列作为所述文本序列对应的音素序列标注结果与所述音素序列预测结果进行比较,得到音素序列预测偏差; 根据所述音素序列预测偏差调整所述待训练的文字音素转化模型参数,当满足训练完成条件时得到文字音素转化模型; 所述方法还包括: 在发音字典中查找重复项,获取具有多种发音的多种感兴趣文字; 获取原始音频素材;所述原始音频素材携带对应发音的原始文本序列的情况下,从所述原始文本序列中提取包含对应的感兴趣文字的单位语句作为对应的感兴趣文本序列,从所述原始音频素材中截取所述单位语句对应发音的素材片段作为感兴趣音频素材;其中,所述感兴趣文本序列包含对应的感兴趣文字且关联有感兴趣音频素材; 基于每一种感兴趣文字对应的感兴趣文本序列及所述感兴趣文本序列关联的感兴趣音频素材,构建所述训练数据库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯音乐娱乐科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励