杭州芯声智能科技有限公司姜黎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州芯声智能科技有限公司申请的专利一种基于神经网络双讲检测的回声消除方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115457928B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210888604.9,技术领域涉及:G10K11/178;该发明授权一种基于神经网络双讲检测的回声消除方法及系统是由姜黎;龚永康;胡奎;孙江涛设计研发完成,并于2022-07-27向国家知识产权局提交的专利申请。
本一种基于神经网络双讲检测的回声消除方法及系统在说明书摘要公布了:本发明提供一种基于神经网络双讲检测的回声消除方法及系统,涉及音频处理技术领域。本发明通过使用双讲检测结果控制线性前处理中自适应滤波器的更新与否;当检测到远端无人声信号时,停止更新自适应滤波器。防止双讲状态或是远端仅存在环境噪声时自适应滤波器由于受到扰动偏离稳定点而发散;通过使用双讲检测结果控制非线性后处理中对于回声的最大抑制量,在检测到近端与远端人耳同时讲话时,结合人耳的听觉掩蔽效应估算出能够掩蔽残留回声所需的最大抑制量。在保留近端有用信号失真度小的同时,残留回声也得到有效抑制;在检测到仅有远端人耳信号单讲时,提升对残留回声信号的抑制,使得残留回声能被彻底去除干净。
本发明授权一种基于神经网络双讲检测的回声消除方法及系统在权利要求书中公布了:1.一种基于神经网络双讲检测的回声消除方法,其特征在于,包括输入信号处理、线性自适应滤波处理、非线性后处理、RNN双讲检测和输出信号处理; 输入信号处理:采集近端的麦克风信号和远端的参考信号,并以数字信号流形式进行传输;将麦克风信号和参考信号分别存储至输入缓冲区中,所述输入缓冲区将信号分块为若干数据块,所述数据块包括麦克风信号数据块dln和参考信号数据块xln;其中l=1,2,3,...表示数据块序号,n=0,1,2,...,n表示每个数据块样点序号,N是每个数据块样点总数; RNN双讲检测:通过递归神经网络RNN对麦克风信号与参考信号进行人声检测,并利用有限状态机控制给出双讲检测状态结果db_flagl,其中,所述双讲检测状态结果db_flagl包括:只有远端有人声的远端单讲状态far_talk_only,只有近端有人声的近端单讲状态near_talk_only和远端近端都有人声的远近端双讲状态doble_talk;所述双讲检测状态结果db_flagl用于对线性自适应滤波处理和非线性后处理进行反馈调节; 线性自适应滤波处理:接收麦克风信号数据块dln、参考信号数据块xln并进行逐点数据处理;数据处理通过NLMS算法进行,并通过双讲检测状态结果db_flagl进行自适应调节,得到自适应更新后的滤波器系数通过滤波器系数计算自适应更新后的残差信号eln; 非线性后处理:用于进一步去残差信号eln中线性残留回声与非线性残留回声信号;得到AEC输出信号数据块outln; 输出信号处理:将去除回声后的AEC输出信号数据块outln存入输出缓冲区,并进行数据合并,得到连续的音频数据流进行输出; 所述非线性后处理通过如下步骤进行: 通过短时傅里叶变换STFT对数据块l的残差信号eln和估计的回声信号进行频域处理,得到频域子带的残差信号复数谱Sel,k、回声信号复数谱残差信号能量谱Pel,k与回声信号其中,k表示频域离散采样点序号,k=0,1,...,NB-1;NB为频域子带总数; 通过如下公式得到残差信号eln中残留回声的能量谱Presl,k: 其中,与为上一个数据块l-1最后样点N计算得到的相关函数值; 通过增益函数Gl,k对复数谱Sel,k进行加权处理,得到最终输出信号复数谱Sol,k: Sol,k=Gl,k·Sel,k 其中,Gl,k为增益函数,Pel,k为残差信号能量谱; 将最终输出信号复数谱Sol,k通过ISTFT短时傅里叶逆变换,得到时域的AEC输出信号数据块outln。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州芯声智能科技有限公司,其通讯地址为:310000 浙江省杭州市杭州经济技术开发区白杨街道科技园路20号14幢3层02室-15;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。