上海稀宇极智科技有限公司金瑞洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海稀宇极智科技有限公司申请的专利一种语音生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120808748B 。
龙图腾网通过国家知识产权局官网在2026-04-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511060135.1,技术领域涉及:G10L13/027;该发明授权一种语音生成方法及装置是由金瑞洋;程卫华;杨明祺设计研发完成,并于2025-04-22向国家知识产权局提交的专利申请。
本一种语音生成方法及装置在说明书摘要公布了:本发明涉及语音生成领域,尤其涉及一种语音生成方法及装置,该方法包括:获取待处理文本、待处理文本对应的初始语音和至少一个情绪类型;根据至少一个情绪类型获取对应的至少一个调整参数;将待处理文本和调整参数,或初始语音和调整参数输入文字转语音单元,对待处理文本转换后的中间语音的语音特征参数或初始语音的语音特征参数进行变换,得到目标语音。本申请能够生成多种情绪混杂的语音,在需要生成非预定情绪的语音情况时不改变语音生成模型结构,快速调整语音生成模型的生成情绪。
本发明授权一种语音生成方法及装置在权利要求书中公布了:1.一种语音生成方法,其特征在于,所述方法包括: 获取待处理文本、所述待处理文本对应的初始语音和至少一个情绪类型; 根据至少一个情绪类型获取对应的至少一个调整参数;所述调整参数用于调整语音特征参数;其中,每个所述情绪类型对应一个情绪单元,所述情绪类型对应的情绪单元用于确定所述情绪类型下的至少一个调整参数类型对应的调整参数; 将所述待处理文本和所述调整参数,或所述初始语音和所述调整参数输入文字转语音单元,对所述待处理文本转换后的中间语音的语音特征参数或所述初始语音的语音特征参数进行变换,得到目标语音; 语音生成模型包括至少两个不同的所述情绪单元和所述文字转语音单元,通过下述步骤训练所述语音生成模型中的目标情绪类型对应的目标情绪单元:获取对应的至少一个语音训练样本,所述语音训练样本包括第一语音样本、第二语音样本与第三语音样本,所述第一语音样本是通过文本转语音模型处理得到的中性语音,所述第二语音样本是所述目标情绪类型对应的语音,且所述第二语音样本的文本内容与所述第一语音样本的文本内容相同,所述第三语音样本的文本内容与所述第一语音样本的文本内容、第二语音样本的文本内容相同,且所述第三语音样本的情绪类型与所述第二语音样本的情绪类型的相似度大于相似阈值;通过所述至少一个语音训练样本对所述目标情绪单元进行训练,再至少基于测试语音样本评估所述目标情绪单元的验证参数,若所述目标情绪单元的评估结果满足预设验证条件,则目标情绪单元训练完毕; 其中,所述根据至少一个情绪类型获取对应的至少一个调整参数,包括:根据至少一个情绪类型,将所述初始语音输入到所述情绪类型对应的至少一个情绪单元中,得到至少一个调整参数类型对应的至少一个初始调整参数;基于融合策略对调整参数类型相同的初始调整参数进行融合,得到至少一个调整参数类型对应的至少一个目标调整参数; 所述通过所述至少一个语音训练样本对所述目标情绪单元进行训练,再至少基于测试语音样本评估所述目标情绪单元的验证参数,若所述目标情绪单元的评估结果满足预设验证条件,则目标情绪单元训练完毕,包括:将所述第一语音样本输入所述目标情绪单元中,得到所述目标情绪类型对应的至少一个调整参数;将所述目标情绪类型对应的至少一个调整参数输入到训练完成的文字转语音单元中对所述第一语音样本进行变换,得到生成语音;根据所述生成语音、所述第二语音样本和所述第三语音样本更新所述目标情绪单元,以使所述生成语音能够向所述第二语音样本靠近,向所述第三语音样本远离;并至少基于测试语音样本评估所述目标情绪单元的验证参数,若所述目标情绪单元的评估结果满足预设验证条件,则目标情绪单元训练完毕。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海稀宇极智科技有限公司,其通讯地址为:200233 上海市徐汇区桂箐路65号1幢1102部位C座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励