南京大学;北京地平线信息技术有限公司侯仲舒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学;北京地平线信息技术有限公司申请的专利基于频谱压缩和神经网络的多阶段全频带语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115273884B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210684643.7,技术领域涉及:G10L21/0232;该发明授权基于频谱压缩和神经网络的多阶段全频带语音增强方法是由侯仲舒;胡沁雯;卢晶;朱长宝;朱天一;刘松设计研发完成,并于2022-06-17向国家知识产权局提交的专利申请。
本基于频谱压缩和神经网络的多阶段全频带语音增强方法在说明书摘要公布了:本发明公开了一种基于频谱压缩和神经网络的多阶段全频带语音增强方法。其步骤为:设计全频带语音频谱压缩曲线,使用设计的参数初始化MHA‑DPCRN的频谱压缩模块;合成模拟含噪混响语音;对模拟含噪混响语音和对应的带混响纯净语音分别做短时傅里叶变换得到两者的短时傅里叶谱;使用短时傅里叶谱训练MHA‑DPCRN模型权重;5对待增强的含噪混响语音做短时傅里叶变换得到短时傅里叶谱;将含噪混响语音的短时傅里叶谱输入完成训练的模型,得到增强语音的短时傅里叶谱,并进行逆短时傅里叶变换得到增强语音的时域信号。本发明的方法能够在复杂噪声场景下对全频带语音进行较为彻底的噪声抑制,同时保留较好的语音音质。
本发明授权基于频谱压缩和神经网络的多阶段全频带语音增强方法在权利要求书中公布了:1.基于频谱压缩和神经网络的多阶段全频带语音增强方法,其特征在于,该方法包括以下步骤: 步骤1,设计全频带语音频谱压缩曲线,根据所述压缩曲线计算压缩模块参数; 步骤2,使用清晰语音数据集、噪声数据集以及房间冲激响应数据集合成模拟含噪混响语音; 步骤3,对所述模拟含噪混响语音的数据和其对应的纯净混响语音数据分别做短时傅里叶变换得到两者的短时傅里叶谱; 步骤4,构建MHA-DPCRN模型,该模型由幅度谱增强网络MHAN和复数谱增强网络DPCRN级联组成;使用步骤1得到的压缩模块参数初始化MHA-DPCRN的频谱压缩模块;使用步骤3得到的短时傅里叶谱训练所述MHA-DPCRN模型权重; 步骤5,对待增强的含噪混响语音信号做短时傅里叶变换得到短时傅里叶谱; 步骤6,将步骤5获得的短时傅里叶谱输入步骤4完成训练的MHA-DPCRN模型,输出增强语音的短时傅里叶谱; 步骤7,对增强语音的短时傅里叶谱进行逆短时傅里叶变换得到增强语音的时域信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学;北京地平线信息技术有限公司,其通讯地址为:210046 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。