北京达佳互联信息技术有限公司强春雨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京达佳互联信息技术有限公司申请的专利音频编解码器的训练方法、音频处理方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120356476B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510863785.3,技术领域涉及:G10L19/022;该发明授权音频编解码器的训练方法、音频处理方法及装置是由强春雨;王小鹏;陈睿龙;梁宇哲;尹慷;张晨;张迪;盖坤设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。
本音频编解码器的训练方法、音频处理方法及装置在说明书摘要公布了:本公开关于一种音频编解码器的训练方法、音频处理方法及装置。该方法包括:基于待训练的预设音频编解码器对样本音频特征进行编解码处理,得到样本音频编码特征、样本变分编码特征以及潜在空间分布;并将样本变分编码特征输入预设音频解码模型进行解码处理,得到重建音频特征;基于重建音频特征和样本音频特征确定第一损失信息;确定潜在空间分布与标准高斯分布的散度距离大于预设散度阈值的情况下,基于散度距离和预设散度阈值得到散度损失信息;根据第一损失信息和散度损失信息对预设音频编解码器进行模型参数调整,直至满足训练迭代结束条件以得到训练好的目标音频编解码器。可以避免散度损失的坍塌问题,以提升音频表征的多样性和保真度。
本发明授权音频编解码器的训练方法、音频处理方法及装置在权利要求书中公布了:1.一种音频编解码器的训练方法,其特征在于,待训练的预设音频编解码器包括预设音频编码模型、预设变分自编码器、预设音频解码模型;所述方法包括: 获取当前训练步数下的样本音频特征; 将所述样本音频特征输入所述预设音频编码模型中进行音频编码处理得到的样本音频编码特征,输入所述预设变分自编码器进行潜在空间分布预测以及特征采样处理,得到样本变分编码特征以及潜在空间分布; 将所述样本变分编码特征输入所述预设音频解码模型进行解码处理,得到重建音频特征;并基于所述重建音频特征和所述样本音频特征,得到第一损失信息; 确定所述潜在空间分布与标准高斯分布的散度距离;并在所述散度距离大于预设散度阈值的情况下,基于所述散度距离和所述预设散度阈值,得到散度损失信息; 根据所述第一损失信息和所述散度损失信息,对所述预设音频编解码器进行模型参数调整; 在所述模型参数调整后,返回所述获取当前训练步数下的样本音频特征的步骤,直至满足训练迭代结束条件,将所述满足训练迭代结束条件时的所述预设音频编解码器作为目标音频编解码器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司,其通讯地址为:100085 北京市海淀区西二旗西路16号院12号楼8层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。