Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 天云融创数据科技(北京)有限公司谭可华获国家专利权

天云融创数据科技(北京)有限公司谭可华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉天云融创数据科技(北京)有限公司申请的专利一种基于变分自编码器的语音合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116364058B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310195823.3,技术领域涉及:G10L13/08;该发明授权一种基于变分自编码器的语音合成方法是由谭可华;吕慧设计研发完成,并于2023-02-24向国家知识产权局提交的专利申请。

一种基于变分自编码器的语音合成方法在说明书摘要公布了:本申请提供一种基于变分自编码器的语音合成方法,涉及自然语言处理技术领域,该方法包括:获取目标文本中各字符分别对应的字符标识、所述目标文本包括的音素、以及所述目标文本对应的语音时长;将所述字符标识、所述音素、以及所述语音时长输入语音合成模型的先验编码模块,获取所述目标文本对应的先验隐变量,所述语音合成模型为对变分自编码器进行训练得到的模型;根据预设映射关系将所述先验隐变量映射,得到先验隐变量映射结果,并将所述先验隐变量映射结果输入所述语音合成模型的解码模块,获取所述目标文本对应的声纹数据;对所述声纹数据进行重采样,得到所述声纹数据对应的声纹特征,根据所述声纹特征生成所述目标文本对应的语音数据。

本发明授权一种基于变分自编码器的语音合成方法在权利要求书中公布了:1.一种基于变分自编码器的语音合成方法,其特征在于,包括: 获取目标文本中各字符分别对应的字符标识、所述目标文本包括的音素、以及所述目标文本对应的语音时长; 将所述字符标识、所述音素、以及所述语音时长输入语音合成模型的先验编码模块,获取所述目标文本对应的先验隐变量,所述语音合成模型为对变分自编码器进行训练得到的模型; 根据预设映射关系将所述先验隐变量映射,得到先验隐变量映射结果,并将所述先验隐变量映射结果输入所述语音合成模型的解码模块,获取所述目标文本对应的声纹数据; 对所述声纹数据进行重采样,得到所述声纹数据对应的声纹特征,根据所述声纹特征生成所述目标文本对应的语音数据; 所述语音合成模型的训练过程,包括: 获取训练语音数据对应的线性频谱,并将线性频谱输入所述变分自编码器的后验编码模块,获取后验隐变量; 将所述训练语音数据对应的语音时长、所述训练语音数据对应的训练文本、以及所述训练语音数据对应的音素输入所述变分自编码器的先验编码模块,获取训练文本对应的先验隐变量; 基于所述后验隐变量和所述训练文本对应的先验隐变量对所述变分自编码器的参数进行调整,至KL散度小于预设阈值,得到所述语音合成模型; 所述基于所述后验隐变量和所述训练文本对应的先验隐变量对所述变分自编码器的参数进行调整,至KL散度小于预设阈值,得到所述语音合成模型,包括: 对所述后验隐变量进行可逆变换,得到后验隐变量可逆变换结果; 对所述训练文本对应的先验隐变量进行映射处理,得到先验隐变量映射结果; 计算所述后验隐变量可逆变换结果与所述先验隐变量映射结果的KL散度; 若所述KL散度小于预设阈值,则确定所述变分自编码器为所述语音合成模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天云融创数据科技(北京)有限公司,其通讯地址为:100025 北京市朝阳区豆各庄金田影视产业园22栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。