东南大学庄程浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于简化注意力编解码网络的滤波求和多通道语音分离方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115910092B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211515165.3,技术领域涉及:G10L21/0272;该发明授权基于简化注意力编解码网络的滤波求和多通道语音分离方法是由庄程浩;周琳;许越;曹焱翔;邓宇汐;程云苓;王启瑞设计研发完成,并于2022-11-29向国家知识产权局提交的专利申请。
本基于简化注意力编解码网络的滤波求和多通道语音分离方法在说明书摘要公布了:本发明公布了一种基于简化注意力编解码网络的滤波求和多通道语音分离方法。本发明选择多通道语音中的某一通道作为参考通道,计算参考通道语音与其余通道语音的归一化互相关特征值、参考通道语音的嵌入特征,两类特征作为第一个简化注意力编解码网络的输入特征,输出参考通道的预滤波器参数,对参考通道语音进行滤波,得到各声源的预分离语音;计算其余通道语音与预分离语音的归一化互相关特征、其余通道语音的嵌入特征,作为第二个简化注意力网络的输入,输出其余通道的滤波器参数,对其余通道语音进行滤波处理,得到各声源的分离语音,与各声源的预分离语音进行求和,得到各声源的最终分离语音。
本发明授权基于简化注意力编解码网络的滤波求和多通道语音分离方法在权利要求书中公布了:1.一种基于简化注意力编解码网络的滤波求和多通道语音分离方法,其特征在于,该方法包含以下步骤: 步骤1、对包含多个声源的多通道语音信号进行分帧,得到帧级别的各通道语音信号,从中选择一个通道的语音信号作为参考通道语音信号,计算与其余通道语音信号的归一化互相关特征,计算参考通道语音信号的嵌入特征,将归一化互相关特征和嵌入特征进行拼接,拼接后的参数作为第一个简化注意力编解码网络的输入特征,输出针对参考通道语音信号的滤波器参数; 步骤2、利用步骤1中简化注意力编解码网络输出的滤波器参数对参考通道语音信号进行滤波,得到各声源的预分离语音信号; 步骤3、计算步骤2中的各声源的预分离语音信号与其余通道语音信号的归一化互相关特征,计算其余通道语音信号的嵌入特征,将归一化互相关特征和嵌入特征进行拼接,拼接后的参数作为第二个简化注意力编解码网络的输入,输出针对其余通道语音信号的滤波器参数; 步骤4、利用步骤3中得到的其余通道的滤波器参数对相应通道的语音信号进行滤波,得到从其余通道语音信号分离出的各声源语音信号,将各声源的预分离语音信号与其余通道分离的各声源语音信号进行相加,得到各声源的最终分离语音。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。