西北大学王小凤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北大学申请的专利一种基于压缩激励块的音高估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119541540B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411623607.5,技术领域涉及:G10L25/51;该发明授权一种基于压缩激励块的音高估计方法是由王小凤;李湛涛;刘晓霞;杨瑞龙;任竹语;程康;余崇男;刘阳洋;耿国华设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。
本一种基于压缩激励块的音高估计方法在说明书摘要公布了:本申请涉及一种基于压缩激励块的音高估计方法,将音频文件转换为对数梅尔频谱图,从而将输入的音频转换为更加易于机器理解的高级表示,筛除冗余信息,保留并强化有助于音高提取的信息。采用压缩激励块对对数梅尔频谱图进行特征提取,提取音频全局特征;同时引入自注意力机制对局部的重要特征进行提取,通过编解码结构获得输入音频对应的音高表示内容,经过估计模块得到音高概率矩阵,根据音高概率矩阵最终确定音频文件的音高估计结果。本申请有效解决了对戏曲音频的音高估计困难的问题,提高了对人声音乐音高预测结果的准确性。
本发明授权一种基于压缩激励块的音高估计方法在权利要求书中公布了:1.一种基于压缩激励块的音高估计方法,其特征在于,包括: 构建音高估计模型;所述音高估计模型包括压缩激励块、残差编解码结构、估计模块;所述残差编解码结构包括编码器、解码器和中间特征变换模块;所述编码器包括多个自注意力残差编码层和多个残差卷积块,所述解码器包括多个自注意残差解码层,所述中间特征变换模块包括多个中间卷积块; 将音频文件转换为对数梅尔频谱图,将所述对数梅尔频谱图输入到所述音高估计模型,得到音高概率矩阵,所述音高概率矩阵中的每个元素对应一种音高的概率; 所述压缩激励块对所述对数梅尔频谱图进行特征提取,得到初步特征图;所述初步特征图输入到所述残差编解码结构中,所述编码器的多个自注意力残差编码层对所述初步特征图进行编码操作,得到特征高维表示,每个自注意力残差编码层的输出输入到对应的残差卷积块进行残差卷积操作,每个残差卷积块的输出输入到所述解码器;所述特征高维表示输入到所述中间特征变换模块进行中间特征变换,得到变换后的特征;所述变换后的特征输入到所述解码器,所述解码器根据所述变换后的特征和所述每个残差卷积块的输出,进行解码操作,得到解码后的特征;所述解码后的特征输入到所述估计模块进行特征提取,得到所述音高概率矩阵; 选取所述音高概率矩阵中元素最大值对应的音高作为所述音频文件的音高估计结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北大学,其通讯地址为:710069 陕西省西安市太白北路229号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励