华南理工大学张军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于多任务网络的麦克风阵列语音增强系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114694670B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210353984.6,技术领域涉及:G10L21/0208;该发明授权一种基于多任务网络的麦克风阵列语音增强系统及方法是由张军;赖志鹏;宁更新;冯义志;余华;陈芳炯;温淼文;季飞设计研发完成,并于2022-04-06向国家知识产权局提交的专利申请。
本一种基于多任务网络的麦克风阵列语音增强系统及方法在说明书摘要公布了:本发明公开了一种基于多任务网络的麦克风阵列语音增强系统及方法,该系统由语音预处理模块、多任务网络模块、多任务损失统计模块、网络权重计算模块和语音重构模块组成。其中,语音预处理模块获取阵列语音、参考回声语音和各个任务目标语音作为输入语音并进行预处理;多任务网络模块完成阵列语音各声道的去混响、回声消除、降噪任务,并将多声道语音融合输出为增强后的语音;多任务损失统计模块用于计算多任务网络模块中各任务的损失值,并统计网络的总损失;网络权重计算模块根据网络的总损失计算梯度,将梯度反向传播,计算得到更新后网络的权重;语音重构模块完成从频域特征到时域语音的映射,得到增强后的干净语音。
本发明授权一种基于多任务网络的麦克风阵列语音增强系统及方法在权利要求书中公布了:1.一种基于多任务网络的麦克风阵列语音增强系统,其特征在于,所述麦克风阵列语音增强系统包括语音预处理模块、多任务网络模块、多任务损失统计模块、网络权重计算模块和语音重构模块,其中, 所述语音预处理模块分别与多任务网络模块和多任务损失统计模块连接,用于获取阵列语音、参考回声语音和各个任务目标语音作为输入语音,对输入语音进行预处理,所述预处理包含语音信号的归一化、提取各声道语音和参考回声语音的对数幅度谱; 所述多任务网络模块分别与语音预处理模块、多任务损失统计模块、网络权重计算模块和语音重构模块连接,完成阵列语音各声道的去混响、回声消除、降噪任务,并将多声道语音融合输出为增强后的语音;所述多任务网络模块,包括M条并联的声道分支网络和1个声道融合子网络,上述每条声道分支网络包括依次顺序连接的1个去混响子网络、1个回声消除子网络和1个降噪子网络,其中M与语音预处理模块中麦克风阵列的阵元数目相同,每条声道分支网络中去混响子网络与回声消除子网络、所述多任务损失统计模块和所述语音预处理模块连接,完成对该声道的混响去除任务;每条声道分支网络中的回声消除子网络与去混响子网络、降噪子网络、所述语音预处理模块和所述多任务损失统计模块连接,利用参考的回声信号,消除该声道的回声分量;每条声道分支网络中的降噪子网络与回声消除子网络、声道融合子网络和所述多任务损失统计模块连接,消除该声道中的噪声分量;所述声道融合子网络分别与M条声道分支网络中的降噪子网络、所述多任务损失统计模块和所述网络权重计算模块连接,利用阵列语音各声道包含的空间信息进行二次增强; 所述多任务损失统计模块分别与多任务网络模块和网络权重计算模块连接,计算多任务网络模块中各任务的损失值,并统计网络的总损失; 所述网络权重计算模块分别与多任务网络模块和多任务损失统计模块连接,根据网络的总损失计算梯度,将梯度反向传播,计算得到更新后网络的权重; 所述语音重构模块与多任务网络模块连接,完成从频域特征到时域语音的映射,得到增强后的干净语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。