平安科技(深圳)有限公司张旭龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利语音合成模型的建立方法、应用方法、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115171650B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210908866.7,技术领域涉及:G10L13/02;该发明授权语音合成模型的建立方法、应用方法、设备及存储介质是由张旭龙;王健宗设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本语音合成模型的建立方法、应用方法、设备及存储介质在说明书摘要公布了:本发明公开了一种语音合成模型的建立方法、应用方法、设备及存储介质,语音合成模型的建立方法包括:获取初始字符串、初始音素、初始声学特征和基础训练模型,其中,基础训练模型包括字符层、音素层和声学特征层;将初始字符串输入字符层以使字符层进行模型训练,并获取字符层输出的字符隐变量;将初始音素和字符隐变量输入音素层以使音素层进行模型训练,并获取音素层输出的音素隐变量;将初始声学特征和音素隐变量输入声学特征层以使声学特征层进行模型训练,得到语音合成模型。提高语音合成模型合成语音的自然度和合成速度。
本发明授权语音合成模型的建立方法、应用方法、设备及存储介质在权利要求书中公布了:1.一种语音合成模型的建立方法,其特征在于,包括: 获取初始字符串、初始音素、初始声学特征和基础训练模型,其中,所述基础训练模型包括字符层、音素层和声学特征层;所述字符层包括第一编码器、第一解码器和第一转换器;所述音素层包括第二编码器、第二解码器和第二转换器;所述声学特征层包括第三编码器和第三解码器; 将所述初始字符串输入所述第一编码器,得到中间字符串; 将所述中间字符串输入所述第一解码器,得到最终字符串; 根据所述初始字符串和所述最终字符串得到字符串损失值,并根据所述字符串损失值对所述字符层进行调整; 将所述中间字符串输入所述第一转换器,得到字符隐变量; 将所述初始音素输入所述第二编码器,得到中间音素; 将所述中间音素输入所述第二解码器,得到最终音素; 根据所述初始音素和所述最终音素得到音素损失值,并根据所述音素损失值对所述音素层进行调整; 将所述字符隐变量输入所述第二编码器对所述音素层进行有监督训练; 将所述中间音素输入所述第二转换器,得到音素隐变量; 将所述初始声学特征输入所述第三编码器,得到中间声学特征; 将所述中间声学特征输入所述第三解码器,得到最终声学特征; 根据所述初始声学特征和所述最终声学特征得到声学特征损失值,并根据所述声学特征损失值对所述声学特征层进行调整; 将所述音素隐变量输入所述第三编码器对所述声学特征层进行有监督训练,得到语音合成模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。