哈尔滨工业大学(深圳)汤步洲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)申请的专利中英文跨语言语音合成方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114664282B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210152018.8,技术领域涉及:G10L13/02;该发明授权中英文跨语言语音合成方法、装置、电子设备及存储介质是由汤步洲;刘超设计研发完成,并于2022-02-18向国家知识产权局提交的专利申请。
本中英文跨语言语音合成方法、装置、电子设备及存储介质在说明书摘要公布了:本发明公开了一种中英文跨语言语音合成方法、装置、电子设备及存储介质,该方法包括利用深度学习中序列到序列任务构建第一跨语言声学模型;将文本数据集处理成包括音素序列、声调序列和语言序列的基础语句;利用模型编码器将基础语句编码成高级上下文语义表示,同时在模型编码器的多个位置引入语言嵌入和说话人嵌入;利用注意力机制学习高级上下文语义表示和声学特征梅尔谱图的映射关系,得到线性加权后的高级上下文语义表示;利用模型解码器将线性加权后的高级上下文语义表示生成原始谱图。本发明方法基于多种策略融合,构建了两种跨语言声学模型,使本发明的中英文跨语言语音合成方法解决了现有的语音合成方法的不足。
本发明授权中英文跨语言语音合成方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种中英文跨语言语音合成方法,其特征在于,包括以下步骤: 利用深度学习中序列到序列任务构建第一跨语言声学模型; 将文本数据集处理成包括音素序列、声调序列和语言序列的基础语句; 利用第一跨语言声学模型编码器将基础语句编码成高级上下文语义表示,同时在第一跨语言声学模型编码器的多个位置引入语言嵌入,在第一跨语言声学模型编码器的多个位置引入说话人嵌入; 利用注意力机制学习高级上下文语义表示和声学特征梅尔谱图的映射关系,得到线性加权后的高级上下文语义表示; 利用第一跨语言声学模型解码器将线性加权后的高级上下文语义表示生成原始谱图; 其中,第一跨语言声学模型基于Tacotron模型,包括:基于CBHG的编码器、基于高斯混合分布的GMMv2b注意力机制模块和解码器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励