中国科学技术大学艾杨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利一种音频处理方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119964584B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510170853.8,技术领域涉及:G10L19/02;该发明授权一种音频处理方法、装置及电子设备是由艾杨;江晓航;郑瑞晨;凌震华设计研发完成,并于2025-02-17向国家知识产权局提交的专利申请。
本一种音频处理方法、装置及电子设备在说明书摘要公布了:本发明公开了一种音频处理方法、装置及电子设备,涉及音频处理领域,获取音频波形,将音频波形输入配置的音频处理模型,通过音频处理模型中的因果编码器将音频波形的MDCT谱编码为一个连续码,并输入至残差标量向量量化器进行量化处理得到量化结果,将量化结果输入因果解码器解码出MDCT谱,并将MDCT谱通过逆MDCT恢复为音频波形。本申请将音频波形的MDCT谱作为音频波形的参数特征并用于编码、量化和解码,实现在提高频域分辨率的同时降低解码阶段的计算复杂度,并且音频处理模型中使用的因果模型结构相对于传统非因果模型结构而言无需输入任何未来信息,因此可大幅降低延迟,提高音频处理效率,满足实时通信场景的使用需求。
本发明授权一种音频处理方法、装置及电子设备在权利要求书中公布了:1.一种音频处理方法,其特征在于,包括: 获取音频波形; 将所述音频波形输入配置的音频处理模型,通过所述音频处理模型中的因果编码器将所述音频波形的离散余弦变换MDCT谱编码为一个连续码,将所述连续码输入至残差标量向量量化器进行量化处理得到量化结果,将所述量化结果输入因果解码器解码出所述MDCT谱,并将所述MDCT谱通过逆MDCT恢复为所述音频波形; 其中,所述残差标量向量量化器包括: 标量量化器集和改进向量量化器集,所述标量量化器集和所述改进向量量化器集采用残差方式连接,所述标量量化器集中的多个标量量化器之间采用残差方式连接,所述改进向量量化器集中的多个改进向量量化器之间采用残差方式连接; 所述标量量化器用于以四舍五入作为量化原则,对所述因果编码器输入的所述连续码进行处理,构建粗略音频轮廓; 所述改进向量量化器用于在所述粗略音频轮廓的基础上细化声学细节,得到所述量化结果; 其中,所述因果编码器包括: 依次串联的第一因果输入卷积层、第一因果改进ConvNeXtv2模块集、第一线性层、因果下采样卷积层和第一因果输出卷积层; 所述第一因果输入卷积层用于对输入的所述MDCT谱进行维度变换的初步处理,并将初步处理结果输入至所述第一因果改进ConvNeXtv2模块集; 所述第一因果改进ConvNeXtv2模块集用于对所述初步处理结果进行深度处理得到深度处理结果,并将所述深度处理结果输入至所述第一线性层; 所述第一线性层用于对所述深度处理结果进行线性变换得到线性变换结果,并将所述线性变化结果输入至所述因果下采样卷积层; 所述因果下采样卷积层用于对所述线性变化结果进行特征下采样得到下采样结果,并将所述下采样结果输入至所述第一因果输出卷积层; 所述第一因果输出卷积层用于对所述下采样结果进行维度变换处理,得到所述连续码; 其中,所述因果解码器包括: 依次串联第二因果输入卷积层、因果上采样卷积层、第二线性层、第二因果改进ConvNeXtv2模块集和第二因果输出卷积层; 所述第二因果输入卷积层用于将输入的所述量化结果恢复为原始维度; 所述因果上采样卷积层用于对原始维度量化结果进行特征上采样,得到上采样结果,并将所述上采样结果输入至所述第二线性层; 所述第二线性层用于对所述上采样结果进行线性变化得到线性变换结果,并将所述线性变换结果输入至所述第二因果改进ConvNeXtv2模块集; 所述第二因果改进ConvNeXtv2模块集用于对所述线性变换结果进行深度处理得到深度处理结果; 所述第二因果输出卷积层用于从所述深度处理结果中得到所述MDCT谱,以将MDCT谱通过逆MDCT恢复为所述音频波形; 其中,所述因果编码器和所述因果解码器的区别是:因果编码器为因果下采样卷积层,因果解码器为因果上采样卷积层。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市包河区金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励