厦门亿联网络技术股份有限公司周建明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门亿联网络技术股份有限公司申请的专利一种语音增强方法、装置、终端设备以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524942B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310601600.2,技术领域涉及:G10L21/02;该发明授权一种语音增强方法、装置、终端设备以及存储介质是由周建明设计研发完成,并于2023-05-25向国家知识产权局提交的专利申请。
本一种语音增强方法、装置、终端设备以及存储介质在说明书摘要公布了:本发明公开了一种语音增强方法、装置、终端设备以及存储介质,所述方法包括:获取若干待增强语音数据,对各待增强语音数据进行加窗处理以及短时傅里叶变换,生成若干第一语音数据;各所述第一语音数据通过预设的正向卷积网络进行复数编码,生成若干第二语音数据;各所述第二语音数据通过长短期记忆网络进行预测,生成若干第三语音数据;各所述第三语音数据通过预设的转置卷积网络进行复数解码,生成若干第四语音数据;依次对各所述第四语音数据进行掩码处理、短时逆傅里叶变换以及去窗处理,生成若干增强处理后的语音数据;通过实施本发明,能够实现对语音数据进行增强的效果。
本发明授权一种语音增强方法、装置、终端设备以及存储介质在权利要求书中公布了:1.一种语音增强方法,其特征在于,包括: 获取若干待增强语音数据,对各所述待增强语音数据进行加窗处理,并将加窗处理后的各待增强语音数据进行短时傅里叶变换,生成若干第一语音数据; 将各所述第一语音数据输入至预设的正向卷积网络中,以使所述正向卷积网络对各所述第一语音数据进行复数编码,生成若干第二语音数据; 将各所述第二语音数据输入至长短期记忆网络中,所述长短期记忆网络根据历史语音数据对当前语音数据进行预测,生成若干第三语音数据; 将各所述第三语音数据输入至预设的转置卷积网络中,以使所述转置卷积网络对各所述第三语音数据进行复数解码,生成若干第四语音数据; 对各所述第四语音数据进行掩码处理,并将经过掩码处理后的各所述第四语音数据进行短时逆傅里叶变换以及去窗处理,生成若干增强处理后的语音数据; 所述预设的正向卷积网络包括:4个层级的正向卷积层;每一所述正向卷积层包括:二维正向卷积层、归一化层以及激活函数层; 所述正向卷积网络对各所述第一语音数据进行复数编码,生成若干第二语音数据,包括: 通过每一层级的正向卷积层对各所述第一语音数据进行二维正向卷积处理,生成若干第二语音数据; 其中,在生成第二语音数据的过程中,前一正向卷积层的输出作为后一正向卷积层的输入;每一正向卷积层在对各所述第一语音数据进行二维正向卷积处理时,对于第一层级的正向卷积层,二维正向卷积层的输入为经过傅里叶变换后输出的两帧第一语音数据;对于第二层级到第四层级的正向卷积层,二维正向卷积层的输入为上一层级当前输出的一帧语音数据,以及上一层级前一次输出的一帧语音数据,输出为一帧语音数据,每一正向卷积层内的二维正向卷积层输出的语音数据依次经过第一归一化层以及第一激活函数层;所述第一归一化层用于对所述语音数据进行归一化处理,所述第一激活函数层用于对归一化后的语音数据进行激活函数处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门亿联网络技术股份有限公司,其通讯地址为:361009 福建省厦门市湖里区高新技术园护安路666号亿联网络总部大楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励