东南大学包浩辰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于增强注意力双路径卷积循环网络的语音增强方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118887967B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411055465.7,技术领域涉及:G10L21/0208;该发明授权基于增强注意力双路径卷积循环网络的语音增强方法及设备是由包浩辰;周琳;杨云雁;闫桐嘉设计研发完成,并于2024-08-02向国家知识产权局提交的专利申请。
本基于增强注意力双路径卷积循环网络的语音增强方法及设备在说明书摘要公布了:本发明公开了一种基于增强注意力双路径卷积循环网络的语音增强方法及设备,方法包括:对含噪训练语音信号进行分帧、加窗处理,计算改进离散余弦变换谱图;构建增强注意力双路径卷积循环网络,由编码器模块、SimAM注意力块、双路径长短时记忆模块、解码器模块和hardtanh函数映射模块组成;将含噪训练语音的改进离散余弦变换谱图、纯净语音分别作为该网络的输入特征和标签,基于组合损失函数训练该增强注意力双路径卷积循环网络;将含噪测试语音信号的改进离散余弦变换谱图作为输入特征,增强注意力双路径卷积循环网络估计对应纯净语音的改进余弦变换谱图,逆变换后得到时域的增强语音。本发明实现了在较小参数量和计算量情况下获得了更好的感知语音质量。
本发明授权基于增强注意力双路径卷积循环网络的语音增强方法及设备在权利要求书中公布了:1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤: 步骤1:将单通道的纯净训练语音信号与各种加性噪声按不同信噪比混合,得到若干含噪训练语音信号; 步骤2、对含噪训练语音信号进行预处理,并计算预处理后的含噪训练语音信号的改进离散余弦变换谱图;其中,改进离散余弦变换谱通过下式得到: , 其中,为含噪训练语音第帧的改进离散余弦变换谱,表示频点,表示预处理后的第帧含噪语音信号,为每一帧的样本序号,N为样本总数; 步骤3、构建增强注意力双路径卷积循环网络,所述增强注意力双路径卷积循环网络由包括SimAM注意力模块、双路径长短时记忆模块、hardtanh函数映射模块、若干个编码器模块和若干个解码器模块,若干编码器模块、双路径长短时记忆模块、若干解码器模块、hardtanh函数映射模块依次顺序连接,每个编码器模块与对应的解码器模块之间还通过SimAM注意力模块进行跳转连接,所述编码器模块用于下采样和特征提取,所述解码器模块用于特征处理和上采样,所述双路径长短时记忆模块用于捕获上下文的依赖关系,所述hardtanh函数映射模块用于对改进离散余弦变换谱图进行缩放;所述双路径长短时记忆模块包括帧内双向循环网络和帧间单向循环网络,所述帧内双向循环网络包括依次连接的双向循环神经网络、全连接层、层归一化,所述帧间单向循环网络包括依次连接的单向循环神经网络、全连接层、层归一化;所述帧内双向循环网络与帧间单向循环网络之间进行残差连接;所述编码器模块包括特征重塑子模块和特征处理子模块,所述解码器模块包括特征处理子模块和特征重塑子模块,所述编码器模块的特征重塑子模块的输出经过一个SimAM注意力块跳跃连接到对应解码器模块的特征重塑子模块的输入端,所述编码器模块的特征处理子模块的输出经过一个SimAM注意力块跳跃连接到对应解码器模块的特征处理子模块的输入端; 步骤4、将含噪训练语音信号的改进离散余弦变换谱图作为增强注意力双路径卷积循环网络的输入特征,纯净训练语音信号作为标签,进行网络训练; 步骤5、将待增强的含噪测试语言信号经过预处理后,计算改进离散余弦变换谱图; 步骤6、将含噪测试语音信号的改进离散余弦变换谱图作为增强注意力双路径卷积循环网络的输入特征,得到估计纯净语音的改进离散余弦变换谱图,再经过逆改进离散余弦变换和后处理,得到时域增强语音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励