东南大学景康祺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120783730B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511286309.6,技术领域涉及:G10L15/02;该发明授权基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法及设备是由景康祺;丁祉涵;周琳;李奥设计研发完成,并于2025-09-10向国家知识产权局提交的专利申请。
本基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法及设备在说明书摘要公布了:本发明公开了一种基于时频‑相位联合感知与CBAM注意力机制的单通道语音增强方法及设备,方法包括:获取加噪语音信号训练数据集;构建基于时频‑相位联合感知与CBAM注意力机制的单通道语音增强网络,具体包括短时傅里叶变换模块、编码器、双路循环网络时序建模单元、第一CBAM注意力模块、第二CBAM注意力模块、幅度解码器、相位解码器、信号重建模块;将训练数据集输入所述单通道语音增强网络,进行网络训练;将待增强的含噪、含混响的单通道测试语音信号输入训练好的单通道语音增强网络,得到增强后的单通道语音信号。本发明增强效果更好,参数数量更少。
本发明授权基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法及设备在权利要求书中公布了:1.一种基于时频-相位联合感知与CBAM注意力机制的单通道语音增强方法,其特征在于,包括: 步骤1、在若干纯净语音信号中加入随机信噪比的噪声信号和随机混响时间的混响信号,得到加噪语音信号,形成训练数据集; 步骤2、构建基于时频-相位联合感知与CBAM注意力机制的单通道语音增强网络,具体包括以下模块: 短时傅里叶变换模块,用于提取加噪语音信号的幅度谱和相位谱; 编码器,用于提取幅度谱和相位谱的局部信息和频率相关性,并将其编码成隐藏向量;所述编码器包括若干依次连接的卷积注意力模块,每个卷积注意力模块包括依次连接的二维卷积层、批归一化层、随机失活Dropout层、LeakyRELU激活函数和自注意力记忆单元,所述自注意力记忆单元包括依次连接的自注意力网络和深度前馈序列记忆网络; 双路循环网络时序建模单元,用于学习隐藏向量的时间维度和频率维度的全局依赖关系,得到隐藏向量的时频关联性特征; 第一CBAM注意力模块,用于对隐藏向量进行增强,并将增强的隐藏向量输出到幅度解码器; 第二CBAM注意力模块,用于对隐藏向量进行增强,并将增强的隐藏向量输出到相位解码器; 幅度解码器,用于基于隐藏向量的时频关联性特征,将增强的隐藏向量映射为幅度谱掩膜; 相位解码器,用于基于隐藏向量的时频关联性特征,将增强的隐藏向量映射为相位谱; 信号重建模块,用于根据幅度谱掩膜和相位谱重建增强后的时域单通道语音信号; 步骤3、将所述训练数据集输入所述单通道语音增强网络,进行网络训练; 步骤4、将待增强的含噪、含混响的单通道测试语音信号输入训练好的单通道语音增强网络,得到增强后的单通道语音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励