维沃移动通信有限公司王睿获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉维沃移动通信有限公司申请的专利音频生成方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119380692B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411497448.9,技术领域涉及:G10L13/033;该发明授权音频生成方法、装置、电子设备及存储介质是由王睿设计研发完成,并于2024-10-24向国家知识产权局提交的专利申请。
本音频生成方法、装置、电子设备及存储介质在说明书摘要公布了:本申请公开了一种音频生成方法、装置、电子设备及存储介质,属于电子设备技术领域,该方法包括获取参考对象和与参考对象相关的笑声特征数据,参考对象包括参考文本和参考音频,参考文本为用于进行笑声合成的文本,参考音频为用于指示生成预设风格的音频;通过频谱生成模型,根据参考对象和笑声特征数据,确定笑声语音频谱数据;将笑声语音频谱数据转换为笑声合成音频,其中,笑声合成音频为预设风格的音频,笑声合成音频包括参考文本的文本内容和与文本内容表征的情感相关的笑声。
本发明授权音频生成方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种音频生成方法,其特征在于,包括: 获取参考对象和与所述参考对象相关的笑声特征数据,所述参考对象包括参考文本和参考音频,所述参考文本为用于进行笑声合成的文本,所述参考音频为用于指示生成预设风格的音频; 通过频谱生成模型中的数据处理模型,对所述参考对象和所述笑声特征数据进行处理,得到频谱生成对象;其中,所述频谱生成对象包括与所述参考文本对应的音素扩充数据、所述参考音频的语音频谱数据和所述笑声特征数据的情感数据,所述音素扩充数据包括汇编文本的汇编音素数据经过扩充音素数据帧后的数据,所述汇编文本为所述参考文本和所述参考音频的音频文本拼接后的文本; 通过所述频谱生成模型中的语音频谱生成模型,按照所述音素扩充数据中每个音素的第二音素时长,将所述音素扩充数据中每个音素与所述参考音频的语音频谱数据中的频谱特征进行对齐,得到对齐音频频谱数据,所述对齐音频频谱数据包括所述语音频谱数据和掩码区域的掩码频谱数据,所述第二音素时长用于表示音素在所述参考音频中预计持续的时长;通过所述情感数据和所述音素扩充数据,对所述掩码区域的音频频谱数据进行重构,得到与所述掩码区域的重构音频频谱数据;将所述对齐音频频谱数据中的掩码频谱数据替换为所述重构音频频谱数据,得到扩充掩码频谱数据;基于所述情感数据,确定所述笑声特征数据在所述扩充掩码频谱数据中的位置;按照所述位置,对所述笑声特征数据与所述扩充掩码频谱数据进行数据融合,得到笑声语音频谱数据; 将所述笑声语音频谱数据转换为笑声合成音频,其中,所述笑声合成音频为所述预设风格的音频,所述笑声合成音频包括所述参考文本的文本内容和与所述文本内容表征的情感相关的笑声。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人维沃移动通信有限公司,其通讯地址为:523863 广东省东莞市长安镇维沃路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励