北京百度网讯科技有限公司赵情恩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利语音处理方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114495956B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210118558.4,技术领域涉及:G10L21/013;该发明授权语音处理方法、装置、设备及存储介质是由赵情恩;梁芸铭;张银辉设计研发完成,并于2022-02-08向国家知识产权局提交的专利申请。
本语音处理方法、装置、设备及存储介质在说明书摘要公布了:本公开提供了语音处理方法、装置、设备及存储介质,数据处理领域,尤其涉及人工智能、深度学习、语音处理技术领域。具体实现方案为:获取待处理文本的音素序列和参考风格音频的风格属性信息,风格属性信息包含说话人特征和韵律特征;利用风格属性信息,得到音素序列对应的音频特征;根据音素序列对应的音频特征,得到待处理文本对应的目标风格音频。根据本公开的技术,将参考风格音频的说话人的风格特性拆解成说话人特性和韵律风格两部分,屏蔽了信道和内容的影响,减弱了二者之间的相互影响,以使目标风格音频的风格属性信息与参考风格音频的风格属性信息高度一致,从而提高了音频的合成质量。
本发明授权语音处理方法、装置、设备及存储介质在权利要求书中公布了:1.一种语音处理方法,包括: 获取待处理文本的音素序列和参考风格音频的风格属性信息,所述风格属性信息包含说话人特征和韵律特征; 利用所述风格属性信息,得到所述音素序列对应的音频特征; 根据所述音素序列对应的音频特征,得到所述待处理文本对应的目标风格音频,以使所述目标风格音频的风格属性信息与所述参考风格音频的风格属性信息相匹配; 其中,利用所述风格属性信息,得到所述音素序列对应的音频特征,包括: 利用所述风格属性信息所包含的说话人特征和韵律特征,对所述音素序列进行文本编码处理,得到所述音素序列的高维语义特征,所述风格属性信息是利用风格编码网络对参考风格音频编码所得;以及, 利用所述风格属性信息所包含的说话人特征和韵律特征,对所述音素序列的高维语义特征进行声谱解码处理,得到所述音素序列对应的音频特征; 其中,利用所述风格属性信息所包含的说话人特征和韵律特征,对所述音素序列进行文本编码处理,得到所述音素序列的高维语义特征,包括: 对待处理文本的音素序列进行位置编码处理,得到包含位置编码信息的第一音素序列; 利用所述风格属性信息所包含的说话人特征和韵律特征,对所述第一音素序列依次进行多注意力机制的高维映射处理和卷积处理,得到所述音素序列的高维语义特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励