北京小米移动软件有限公司;北京小米松果电子有限公司吴洁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京小米移动软件有限公司;北京小米松果电子有限公司申请的专利音频生成方法、装置、存储介质及芯片获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115240638B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210887736.X,技术领域涉及:G10L13/10;该发明授权音频生成方法、装置、存储介质及芯片是由吴洁;栾剑;孟猛;高高设计研发完成,并于2022-07-26向国家知识产权局提交的专利申请。
本音频生成方法、装置、存储介质及芯片在说明书摘要公布了:本公开涉及一种音频生成方法、装置、存储介质及芯片,该音频生成方法通过将该目标文本信息输入预设音频合成模型,以获取该目标文本信息对应的指定音色的音频数据;该预设音频合成模型包括门控网络和多个特征提取网络,该门控网络用于从该多个特征提取网络中确定目标特征提取网络,该目标特征提取网络用于确定该目标文本信息对应的该目标音频数据。这样,通过预设音频合成模型中的门控网络从该多个特征提取网络中确定目标特征提取网络,然后通过该目标特征提取网络确定该目标文本信息对应的该目标音频数据,能够有效克服相关技术中训练数据较少时,模型容易出现过拟合现象的问题,也能够明显减少生成目标音频数据所需的计算量。
本发明授权音频生成方法、装置、存储介质及芯片在权利要求书中公布了:1.一种音频生成方法,其特征在于,包括: 获取目标文本信息; 将所述目标文本信息输入预设音频合成模型,以获取所述预设音频合成模型输出的目标音频数据,所述目标音频数据为所述目标文本信息对应的指定音色的音频数据; 其中,所述预设音频合成模型包括门控网络和多个特征提取网络,不同的特征提取网络用于提取不同维度的特征数据,所述门控网络用于从所述多个特征提取网络中确定目标特征提取网络,所述目标特征提取网络用于确定所述目标文本信息对应的所述目标音频数据; 所述门控网络,用于输出每个特征提取网络对应维度特征对目标音频数据生成的影响比重,并根据所述影响比重筛选出影响更大的维度,将所述影响更大的维度对应的特征提取网络作为目标特征提取网络; 所述预设音频合成模型可以通过以下方式训练得到: 获取多个所述指定音色的第一音频样本数据,以及所述第一音频样本数据对应的第一文本信息; 以多个所述第一音频样本数据和每个所述第一音频样本数据对应的第一文本信息为训练数据,对预设的预训练模型进行模型训练,以得到所述预设音频合成模型; 所述预训练模型通过以下方式训练得到: 获取多个不同音色的第二音频样本数据,以及所述第二音频样本数据对应的第二文本信息; 以所述多个不同音色的第二音频样本数据以及所述第二音频样本数据对应的第二文本信息为训练数据,对预设初始模型进行训练,以得到所述预训练模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京小米移动软件有限公司;北京小米松果电子有限公司,其通讯地址为:100085 北京市海淀区西二旗中路33号院6号楼8层018号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励