科大讯飞股份有限公司李世豪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大讯飞股份有限公司申请的专利语音合成方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121354534B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511905765.4,技术领域涉及:G10L13/027;该发明授权语音合成方法、装置、电子设备及存储介质是由李世豪;朱荣华;孔乐天;蔡明琦;孙磊;胡亚军;祖漪清;高建清;刘聪设计研发完成,并于2025-12-17向国家知识产权局提交的专利申请。
本语音合成方法、装置、电子设备及存储介质在说明书摘要公布了:本发明提供一种语音合成方法、装置、电子设备及存储介质,涉及语音合成技术领域,所述方法首先获取待合成文本,然后根据加载的语种规则确定待合成文本的发音特征,接着通过语音合成模型根据发音特征对待合成文本进行语音合成,得到目标合成语音,能够根据语种规则能够从构词特性、待合成文本的字素间的上下文依赖等维度确定待合成文本的发音特征,使待合成文本的发音特征更符合语种特性,从而增加得到的待合成文本的发音特征的准确度,语音合成模型根据准确度更高的发音特征对待合成文本进行语音合成,能够提高语音合成的质量。
本发明授权语音合成方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种语音合成方法,其特征在于,包括: 获取待合成文本; 加载语种规则,以根据所述语种规则确定所述待合成文本的发音特征; 将所述发音特征输入至语音合成模型,得到所述语音合成模型输出的所述待合成文本对应的目标合成语音; 其中,所述语音合成模型基于样本发音特征以及所述样本发音特征对应的样本合成语音进行训练得到; 所述加载语种规则,以根据所述语种规则确定所述待合成文本的发音特征,包括: 加载语种规则的规则表,以根据所述规则表确定所述待合成文本的发音特征;其中,不同语种的规则表的格式相同; 所述规则表包括发音单元和对应的音素; 根据所述规则表确定所述待合成文本的发音特征,包括: 根据所述规则表对所述待合成文本的字素进行匹配处理,得到所述字素的目标发音子串和对应的目标发音单元; 根据所述目标发音单元对应的音素确定所述目标发音子串的音素,以根据每个所述目标发音子串的音素得到所述字素的音素序列; 所述根据所述目标发音单元对应的音素确定所述目标发音子串的音素,包括: 根据所述目标发音单元对应的音素集合获取所述目标发音子串的候选音素集合和对应的至少两个音素选取规则; 根据所述目标发音单元对应的音素集合获取所述目标发音子串的候选音素集合和对应的至少两个音素选取规则之后,所述方法还包括: 确定所述目标发音子串的相邻发音子串,根据所述规则表得到所述相邻发音子串的类型; 根据所述音素选取规则匹配所述相邻发音子串的类型,以判断所述目标发音子串是否满足音素选取规则; 所述目标发音子串满足目标音素选取规则的情况下,确定所述候选音素集合中所述目标音素选取规则对应的候选音素为所述目标发音子串的音素。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新开发区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励