北京羽扇智信息科技有限公司殷昊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京羽扇智信息科技有限公司申请的专利语音合成方法、装置、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115547288B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211137412.0,技术领域涉及:G10L13/02;该发明授权语音合成方法、装置、电子设备和存储介质是由殷昊;梁婷;陈云琳设计研发完成,并于2022-09-19向国家知识产权局提交的专利申请。
本语音合成方法、装置、电子设备和存储介质在说明书摘要公布了:本公开提供了一种语音合成方法、装置、电子设备和存储介质。本公开实施例的语音合成方法可以包括:获取第一文本和第一发音人的信息,第一文本携带第一语气标签;通过预先训练的声学模型生成对应第一发音人和第一文本的第一语气声学特征,第一语气声学特征中包含对应第一发音人和第一文本的声学特征和对应第一语气标签的语气特征;将第一语气声学特征合成带有语气的第一语音,第一语音的语气与第一语气标签一致且第一语音具有第一发音人的发音特征;其中,声学模型根据M个第二发音人的语料、M个第二发音人的信息和第一发音人的信息训练得到,M为大于或等于1的整数。本公开采用特征迁移技术实现了带有语气的语音合成,能够在不降低语音合成质量的同时提升语音的自然度和表现力。
本发明授权语音合成方法、装置、电子设备和存储介质在权利要求书中公布了:1.一种语音合成方法,其特征在于,包括: 获取第一文本和第一发音人的信息,所述第一文本携带第一语气标签; 通过预先训练的声学模型生成对应所述第一发音人和所述第一文本的第一语气声学特征,所述第一语气声学特征中包含对应所述第一发音人和所述第一文本的声学特征和对应所述第一语气标签的语气特征; 将所述第一语气声学特征合成带有语气的第一语音,所述第一语音的语气与所述第一语气标签一致且所述第一语音具有所述第一发音人的发音特征; 其中,所述声学模型根据M个第二发音人的语料、所述M个第二发音人的信息和所述第一发音人的信息训练得到,M为大于或等于1的整数; 其中,所述M个第二发音人的语料包括: 第二文本; N个语气标签,每个语气标签代表一种语气,N为大于1的整数; 内容与所述第二文本一致的N类真实语音,每类真实语音带有一种语气且包含至少一条真实语音,每条所述真实语音对应一个所述第二发音人; 所述声学模型包括第一编码器、第二编码器和解码器; 所述声学模型通过如下方式训练得到: 对所述第二文本和N个语气标签同步执行所述第一编码器的处理,以获得N个语气文本特征,所述语气文本特征包含所述语气标签的文本特征和所述第二文本的文本特征; 对所述M个第二发音人的信息和所述第一发音人的信息同步执行第二编码器的处理,以获得M个第二发音人的特征和第一发音人的特征; 对所述M个第二发音人的特征、第一发音人的特征和所述N个语气文本特征同步执行所述编码器的处理,以获得多个第二语气声学特征; 根据所述多个第二语气声学特征与所述语料中相应真实语音的声学特征,更新所述第一编码器、第二编码器和解码器的参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京羽扇智信息科技有限公司,其通讯地址为:100044 北京市海淀区高梁桥斜街42号院1号楼-1层-101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。