南京航空航天大学陈华伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于麦克风阵列的低时延语音增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119229885B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411371287.9,技术领域涉及:G10L21/02;该发明授权一种基于麦克风阵列的低时延语音增强方法是由陈华伟;李妍文设计研发完成,并于2024-09-29向国家知识产权局提交的专利申请。
本一种基于麦克风阵列的低时延语音增强方法在说明书摘要公布了:本发明公开了一种基于麦克风阵列的低时延语音增强方法,该方法包括:设置一组初始极点参数,利用人工神经网络优化初始极点参数,得到实数极点;利用实数极点构建麦克风阵列各通道的正交基函数模型,并计算各阶滤波器响应;对麦克风阵列接收信号进行分帧和时域特征提取,并利用改进的时序网络估计正交基函数模型构成的自适应波束形成器权值;根据滤波器响应和波束形成器权值计算波束形成网络各通道系统响应,获得增强后的完整语音信号。本发明通过使用正交基结构波束形成网络,可以灵活调节极点,提升网络自由度,缩短滤波器长度,降低网络时延;在滤波器长度更短的情况下,达到更好的语音增强效果。
本发明授权一种基于麦克风阵列的低时延语音增强方法在权利要求书中公布了:1.一种基于麦克风阵列的低时延语音增强方法,其特征在于,包括如下步骤: 步骤1,设置一组初始极点参数,利用人工神经网络优化初始极点参数,得到实数极点,将该实数极点作为麦克风阵列各通道多极点正交基函数模型的参数; 步骤2,利用实数极点构建麦克风阵列各通道的正交基函数模型,并计算各阶滤波器响应; 步骤3,对麦克风阵列接收信号进行分帧和时域特征提取,并利用改进的时序网络估计正交基函数模型构成的自适应波束形成器权值;具体过程如下: 对麦克风接收信号进行分帧,帧长为W,帧移J=W2,则麦克风阵列的第m个通道的第k帧信号表示为: umk=[umk-1J+1,…,umk-1J+W]T 非因果特征提取和滤波情况下,拼接当前帧信号和其上下文信息,得到拼接信号为: vmk=[umk-1J-C+1,…,umk-1J+W+C]T 式中,C表示上文或下文拼接信息的长度; 通过参考麦克风接收信号urefk和vmk提取麦克风阵列各通道的特征向量ξmk,并将特征向量ξmk输入到改进的时序网络SeqNet·中,得到自适应波速形成器的权值; 改进的时序网络SeqNet·开始位置包括一个输出通道数为B的线性瓶颈层,则状态空间方程对应的帧级各通道自适应波速形成器的权值被估计为: wmk=OutputLayerSeqNetξmk 式中,wmk=[wm,1k,…,wm,Lk]T为自适应波速形成器权值的组成向量; 改进的时序网络SeqNet·的输出层OutputLayer·由一维卷积神经网络和激活函数组成,具体设置如下: OutputLayerp=PReLUηWp+q 式中,为时序网络的输出,和分别为一维卷积神经网络的权值和偏置,η为控制一维卷积神经网络输出的尺度因子,PReLU·为参数矫正线性单元激活函数; 步骤4,根据滤波器响应和波束形成器权值计算波束形成网络各通道系统响应,并对麦克风阵列接收信号进行滤波求和,得到增强后的帧级语音信号,对增强后的帧级语音信号进行重叠相加操作,获得增强后的完整语音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:213300 江苏省常州市溧阳市滨河东路29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励