北京搜狗科技发展有限公司方鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京搜狗科技发展有限公司申请的专利一种语音合成方法、装置和用于语音合成的装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113889070B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111162896.X,技术领域涉及:G10L13/02;该发明授权一种语音合成方法、装置和用于语音合成的装置是由方鹏;刘恺设计研发完成,并于2021-09-30向国家知识产权局提交的专利申请。
本一种语音合成方法、装置和用于语音合成的装置在说明书摘要公布了:本发明实施例提供了一种语音合成方法、装置和用于语音合成的装置,应用于终端设备。其中的方法包括:基于多人语音训练数据训练多人声学模型,所述多人声学模型包括编码器、韵律预测网络、时长预测网络、以及解码器;所述解码器输出的声学特征中包含基频特征和梅尔谱特征;基于目标说话人的单人语音训练数据对所述多人声学模型进行自适应训练,得到所述目标说话人的单人声学模型;对所述单人声学模型进行参数定点化处理,得到目标单人声学模型;利用所述目标单人声学模型以及待合成文本合成所述目标说话人的声学特征的音频数据。本发明实施例在保证模型效果的基础上,使得训练得到的目标单人声学模型可适用于计算能力和存储空间有限的离线设备。
本发明授权一种语音合成方法、装置和用于语音合成的装置在权利要求书中公布了:1.一种语音合成方法,其特征在于,所述方法包括: 基于多人语音训练数据训练多人声学模型,所述多人声学模型包括编码器、韵律预测网络、时长预测网络、以及解码器;所述解码器输出的声学特征中包含基频特征和梅尔谱特征;所述韵律预测网络、时长预测网络、音色预测网络相互独立,并进行端到端的联合训练; 基于目标说话人的单人语音训练数据对所述多人声学模型进行自适应训练,得到所述目标说话人的单人声学模型; 对所述单人声学模型进行参数定点化处理,以得到目标单人声学模型; 利用所述目标单人声学模型以及待合成文本合成所述目标说话人的声学特征的音频数据; 所述基于多人语音训练数据训练多人声学模型,包括: 将文本编码序列输入所述多人声学模型的韵律预测网络,预测所述文本编码序列中各字符音素的韵律特征,输出所述文本编码序列对应的韵律特征序列; 将时长序列和所述韵律特征序列输入所述多人声学模型的解码器,输出与所述文本编码序列对应的预测的声学特征; 根据所述预测的声学特征和提取的声学特征之间的差异迭代更新所述多人声学模型的模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京搜狗科技发展有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励