中国科学院声学研究所李军锋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院声学研究所申请的专利一种广播通信场景的近端语音可懂度增强方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116129928B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310049766.8,技术领域涉及:G10L21/0232;该发明授权一种广播通信场景的近端语音可懂度增强方法和系统是由李军锋;李伟;顾建军设计研发完成,并于2023-02-01向国家知识产权局提交的专利申请。
本一种广播通信场景的近端语音可懂度增强方法和系统在说明书摘要公布了:本发明实施例公开了一种适用于广播通信场景的近端语音可懂度增强方法和系统。该近端语音可懂度增强方法,首先在近端估计出语音和噪声,然后基于语音和噪声利用近端语音可懂度增强算法得到频带增益,最后将频带增益应用于原始的广播语音得到可懂度增强后的语音并在远端进行播放。本发明提供的实施例公开的一种广播通信场景的近端语音可懂度增强系统,将上述方法在基于卡尔曼估计方法和可懂度增强算法应用场景所对应的广播系统中实现。该系统提高了语音的通信质量,并且算法计算量较小,使得系统可以实现实时运行。
本发明授权一种广播通信场景的近端语音可懂度增强方法和系统在权利要求书中公布了:1.一种广播通信场景的近端语音可懂度增强方法,其特征在于,包括: 获取原始广播的远端参考语音和麦克风采集的近端混合语音;所述近端混合语音包括混合了背景噪声的经过衰减后的远端参考语音; 对参考语音和混合语音进行特征提取,获得所述参考语音和混合语音的傅里叶频谱;在短傅里叶变换域,针对所述参考语音和混合语音的传播路径建立基于自回归信号模型的卡尔曼滤波器,将参考语音和混合语音的傅里叶频谱输入所述卡尔曼滤波器得到参考语音和混合语音最优的自回归系数;利用所述自回归系数进行估计获得近端的语音信号和噪声信号; 对所述语音信号和噪声信号进行特征提取,获得所述语音信号和噪声信号的傅里叶频谱;对语音信号的傅里叶频谱进行语音活动性检测,将语音信号和噪声信号的傅里叶频谱输入三分之一倍频程滤波器获得第一输出结果;利用可懂度增强算法对第一输出结果进行计算获得所述语音信号和噪声信号的频带能量,对所述频带能量进行频带间重分配获得所述语音信号的频带增益; 对原始广播语音进行特征提取,获得广播语音的傅里叶频谱;对广播语音的傅里叶频谱进行语音活动性检测并输入三分之一倍频程滤波器后获得第二输出结果;将第二输出结果与所述频带增益进行乘法运算得到可懂度增强后的语音频谱,对所述可懂度增强后的语音频谱进行傅里叶逆变换得到可懂度增强后的广播语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院声学研究所,其通讯地址为:100190 北京市海淀区北四环西路21号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。