问问智能信息科技有限公司江明奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉问问智能信息科技有限公司申请的专利一种语音合成方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115497450B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211123920.3,技术领域涉及:G10L13/027;该发明授权一种语音合成方法和装置是由江明奇;王瑞;陈云琳;叶顺平设计研发完成,并于2022-09-15向国家知识产权局提交的专利申请。
本一种语音合成方法和装置在说明书摘要公布了:本申请实施例公开了一种语音合成方法及装置,包括:获取文本数据和文本数据对应的音高数据,文本数据中包含多个文本,音高数据表征每个文本对应的音高;对文本数据和音高数据进行编码,得到文本特征数据和音高特征数据;对多个文本进行时长预测,得到每个文本的预测时长,预测时长表征该文本对应的帧数;将文本特征数据和音高特征数据进行合并,得到第一特征数据;利用每个文本的预测时长对第一特征数据进行时长扩充,得到第二特征数据;对第二特征数据进行解码,得到语音谱参数,并将语音谱参数输入预训练的神经网络声码器,生成并得到目标语音。
本发明授权一种语音合成方法和装置在权利要求书中公布了:1.一种语音合成方法,其特征在于,所述方法包括: 获取文本数据和所述文本数据对应的音高数据,所述文本数据中包含多个文本,所述音高数据表征每个文本对应的音高; 对所述文本数据和音高数据进行编码,得到文本特征数据和音高特征数据; 对所述多个文本进行时长预测,得到每个文本的预测时长,所述预测时长表征该文本对应的帧数; 将所述文本特征数据和音高特征数据进行合并,得到第一特征数据; 利用所述每个文本的预测时长对所述第一特征数据进行时长扩充,得到第二特征数据; 对所述第二特征数据进行解码,得到语音谱参数,并将所述语音谱参数输入预训练的神经网络声码器,生成并得到目标语音; 所述将所述文本特征数据和音高特征数据进行合并,包括: 从所述文本特征数据和音高特征数据中确定出每个文本对应的文本子特征数据和音高子特征数据; 根据所述文本的文本子特征数据和音高子特征数据确定该文本的第一子特征数据; 将所有第一子特征数据按照对应的文本在所述文本数据中的顺序进行合并,得到第一特征数据; 所述利用所述每个文本的预测时长对所述第一特征数据进行时长扩充,得到第二特征数据,包括: 从所述第一特征数据中确定出每个文本对应的第一子特征数据; 按照所述文本的预测时长将该文本对应的第一子特征数据扩充到该预测时长所指示的帧数,得到第二子特征数据; 将所述第二子特征数据按照对应的文本在所述文本数据中的顺序进行合并,得到第二特征数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人问问智能信息科技有限公司,其通讯地址为:100044 北京市海淀区高梁桥斜街42号院1号楼4层2-406;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。