北京达佳互联信息技术有限公司许成林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京达佳互联信息技术有限公司申请的专利人声伴奏分离模型的训练方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116259329B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310118490.4,技术领域涉及:G10L21/0272;该发明授权人声伴奏分离模型的训练方法、装置及电子设备是由许成林;郑羲光;张晨设计研发完成,并于2023-02-02向国家知识产权局提交的专利申请。
本人声伴奏分离模型的训练方法、装置及电子设备在说明书摘要公布了:本公开关于一种人声伴奏分离模型的训练方法、装置及电子设备,涉及互联网技术领域。方法包括:对于多个样本音频中的任一样本音频,基于人声伴奏分离模型中的人声伴奏分离网络对样本音频进行人声伴奏分离,得到预测人声和预测伴奏;基于人声伴奏分离模型中的人声判别器,对预测人声进行判别,得到第一判别结果;基于人声伴奏分离模型中的伴奏判别器,对预测伴奏进行判别,得到第二判别结果;基于样本音频、预测人声、预测伴奏、第一判别结果以及第二判别结果,对人声伴奏分离模型进行训练。根据本公开的技术方案,实现了提高了人声伴奏分离模型的泛化能力,也使得训练得到的人声伴奏分离模型分离的人声和伴奏的准确性提高。
本发明授权人声伴奏分离模型的训练方法、装置及电子设备在权利要求书中公布了:1.一种人声伴奏分离模型的训练方法,其特征在于,所述方法包括: 对于多个样本音频中的任一样本音频,基于人声伴奏分离模型中的人声伴奏分离网络对所述样本音频进行人声伴奏分离,得到预测人声和预测伴奏,所述多个样本音频包括具有监督信息的有监督样本音频和不具有监督信息的无监督样本音频,所述人声伴奏分离模型用于分离输入的音频中的人声和伴奏,所述人声伴奏分离网络基于所述多个样本音频中的有监督样本音频预训练得到; 基于所述人声伴奏分离模型中的人声判别器,对所述预测人声进行判别,得到第一判别结果,所述第一判别结果用于表示是否为预测人声; 基于所述人声伴奏分离模型中的伴奏判别器,对所述预测伴奏进行判别,得到第二判别结果,所述第二判别结果用于表示是否为预测伴奏; 在所述样本音频为有监督样本音频的情况下,基于所述样本音频、所述预测人声、所述预测伴奏、所述第一判别结果和所述第二判别结果,确定第一生成器损失,所述第一生成器损失用于指示所述人声伴奏分离网络的损失; 基于所述样本音频、所述第一判别结果、所述第二判别结果、第三判别结果以及第四判别结果,确定第一判别器损失,所述第三判别结果为所述人声判别器对所述样本音频中的参考人声的判别结果,所述第四判别结果为所述伴奏判别器对所述样本音频中的参考伴奏的判别结果,所述第一判别器损失用于指示所述人声判别器和所述伴奏判别器的损失; 基于所述第一生成器损失和所述第一判别器损失,对所述人声伴奏分离模型进行训练; 在所述样本音频为无监督样本音频的情况下,基于所述样本音频、所述第一判别结果以及所述第二判别结果,确定第二判别器损失,所述第二判别器损失用于指示所述人声判别器和所述伴奏判别器的损失; 基于所述样本音频、所述预测人声、所述预测伴奏、所述第一判别结果以及所述第二判别结果,确定第二生成器损失,所述第二生成器损失用于指示所述人声伴奏分离网络的损失; 基于所述第二生成器损失和所述第二判别器损失,对所述人声伴奏分离模型进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司,其通讯地址为:100085 北京市海淀区上地西路6号1幢1层101D1-7;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励