平安科技(深圳)有限公司张旭龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利语音合成方法、装置、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115359780B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210897499.5,技术领域涉及:G10L13/10;该发明授权语音合成方法、装置、计算机设备及存储介质是由张旭龙;王健宗设计研发完成,并于2022-07-28向国家知识产权局提交的专利申请。
本语音合成方法、装置、计算机设备及存储介质在说明书摘要公布了:本发明公开了一种语音合成方法、装置、计算机及存储介质,该方法包括:对文本序列进行处理,获取文本隐向量;对韵律参照音频进行韵律特征提取,获取韵律隐向量;获取用户标识对应的用户编码向量;对所述文本隐向量、所述韵律隐向量和用户编码向量进行合成,获取目标声学特征;基于所述目标声学特征进行语音合成,获取所述文本序列对应的目标音频文件。该方法使得获取到的目标音频文件不仅与文本序列对应的文本内容相关,还与韵律参照音频中的韵律风格和用户标识对应的用户语音音色相关,有助于保障目标音频文件的语音合成效果,提高合成语音的自然度。
本发明授权语音合成方法、装置、计算机设备及存储介质在权利要求书中公布了:1.一种语音合成方法,其特征在于,包括: 对文本序列进行处理,获取文本隐向量; 对韵律参照音频进行韵律特征提取,从韵律参照音频中提取出与所述韵律参照音频的语音发音方式相关的韵律风格信息,对提取到的韵律风格信息进行编码,获取韵律风格编码;所述韵律参照音频是预先设置的用于提供作为参考对象的韵律风格的音频;所述韵律风格信息为与文本内容无关的韵律表达特征;所述韵律风格编码为韵律风格信息进行编码的编码结果; 对所述韵律参照音频进行频谱转换,获取韵律参照频谱,采用二维卷积网络对韵律参照频谱进行处理,输出频谱特征信息,将频谱特征信息和所述韵律风格编码进行拼接或者融合,输出采用二维矩阵形式表示的韵律特征向量;所述韵律特征向量为反映韵律音素-时间相应关系的二维矩阵; 采用时长控制模块对韵律特征向量进行时长对齐,对列向量进行扩展,得到扩展后的二维矩阵作为韵律隐向量; 获取用户标识对应的用户编码向量; 采用注意力机制对所述文本隐向量、所述韵律隐向量和所述用户编码向量进行合成,获取目标声学特征; 基于所述目标声学特征进行语音合成,获取所述文本序列对应的目标音频文件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励