北京生数科技有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京生数科技有限公司申请的专利音频生成的方法、装置、存储介质、电子设备和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120340507B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510821684.X,技术领域涉及:G10L19/008;该发明授权音频生成的方法、装置、存储介质、电子设备和程序产品是由请求不公布姓名设计研发完成,并于2025-06-19向国家知识产权局提交的专利申请。
本音频生成的方法、装置、存储介质、电子设备和程序产品在说明书摘要公布了:本公开实施例公开了一种音频生成的方法、装置、存储介质、电子设备和程序产品,将获取的音频生成任务的引导信息进行编码,得到所述引导信息的隐空间表达;基于扩散模型,利用混合引导策略和所述引导信息的隐空间表达,逐步进行去噪迭代,得到目标数据;其中,所述扩散模型包括原模型和降级模型,所述混合引导策略用于引导所述原模型和所述降级模型分别进行无分类器引导;将所述目标数据解码至音频空间,得到所述音频生成任务对应的音频信息。本公开通过引导原模型和降级模型分别进行无分类器引导和降级模型引导的混合引导策略使得引导路径更具结构性和鲁棒性,有效提升了语义保真度和音频信号的自然度。
本发明授权音频生成的方法、装置、存储介质、电子设备和程序产品在权利要求书中公布了:1.一种音频生成的方法,其特征在于,包括: 将获取的音频生成任务的引导信息进行编码,得到所述引导信息的隐空间表达; 基于扩散模型,利用混合引导策略和所述引导信息的隐空间表达,逐步进行去噪迭代,得到目标数据;其中,所述扩散模型包括原模型和降级模型,所述混合引导策略用于引导所述原模型和所述降级模型分别进行无分类器引导,所述原模型为训练完备的主扩散模型,所述降级模型为相对于所述原模型的训练不充分的模型; 将所述目标数据解码至音频空间,得到所述音频生成任务对应的音频信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京生数科技有限公司,其通讯地址为:100086 北京市海淀区中关村东路8号东升大厦AB座八层801A单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。