Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)张宏伟获国家专利权

哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)张宏伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种基于深度学习的单通道语音分离的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116612779B

龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310620353.0,技术领域涉及:G10L21/0272;该发明授权一种基于深度学习的单通道语音分离的方法是由张宏伟;刘润玲设计研发完成,并于2023-05-29向国家知识产权局提交的专利申请。

一种基于深度学习的单通道语音分离的方法在说明书摘要公布了:本发明提供一种基于深度学习的单通道语音分离的方法,包括以下步骤:步骤1,编码阶段:接收单个麦克风采集的混合语音信号,并将所接收的混合语音信号的时域波形划分为多个短段,再将多个短段转换为中间特征空间中对应的高维特征表示输出到下一步骤;步骤2,分离阶段:接收步骤1的高维特征表示并输出每个源信号对应的掩蔽估计,进而在特征空间中得到分离源的特征表示,以实现分离,从而得到分离特征,将分离特征输出到下一步骤;步骤3,解码阶段:接收步骤2输出的分离特征并将其转换为对应源信号的时域波形估计。本发明的有益效果是:1.本发明方法提升了语音分离的性能。

本发明授权一种基于深度学习的单通道语音分离的方法在权利要求书中公布了:1.一种基于深度学习的单通道语音分离的方法,其特征在于,包括以下步骤: 步骤1,编码阶段:接收单个麦克风采集的混合语音信号,并将所接收的混合语音信号的时域波形划分为多个短段,再将多个短段转换为中间特征空间中对应的高维特征表示输出到下一步骤; 步骤2,分离阶段:接收步骤1的高维特征表示并输出每个源信号对应的掩蔽估计,进而在特征空间中得到分离源的特征表示,以实现分离,从而得到分离特征,并将分离特征输出到下一步骤; 步骤3,解码阶段:接收步骤2输出的分离特征并将其转换为对应源信号的时域波形估计; 所述步骤2中,所述分离阶段具体包括: 步骤20,首先对接收到的编码器输出进行层标准化的操作,再将标准化后的特征表示输入瓶颈层; 步骤21,将瓶颈层的输出Z输入由基于Conformer的双路径多尺度时延模块堆叠而成的分离结构,其中每个DP-MSTD-Conformer模块都通过整合全局信息和不同尺度的局部信息来形成DP-MSTD-Conformer模块的输出; 步骤22,利用一维门控卷积层来得到每个源信号在特征空间中对应的掩蔽估计,将其作用于混合物的高维特征表示即得到对应的特征估计; 所述DP-MSTD-Conformer模块的底层与顶层各为一个前馈模块,所述前馈模块将层标准化的操作提前,并使用Swish激活函数进行非线性变换,在Swish激活函数和第二个线性层之后分别增加dropout操作,以提升网络的泛化性,为了学习到位置信息,将所述前馈模块的第一个线性层替换为循环神经网络; 所述DP-MSTD-Conformer模块最后通过一个标准化层对特征维度进行标准化以得到整个DP-MSTD-Conformer模块的输出,整个DP-MSTD-Conformer模块的输出将作为下一个DP-MSTD-Conformer模块的输入继续进行特征学习; 所述DP-MSTD-Conformer模块使用改进的双路径变换器模块对长序列的全局特征进行学习,具体步骤如下: 步骤S1,分段步骤:以P个时间步为间隔将长序列输入分割成长度为K的短块; 步骤S2,处理步骤:将步骤S1分段后的特征输入双路径结构分别进行块内特征处理和块间特征处理以获取全局特征; 步骤S3,重叠累加步骤:将块间改进的变换器的输出按照分段的规律排列成重叠的短段,并且在相同的时间步上进行累加操作,最后删去最开始零填充位置对应的特征向量,得到DPTi模块的输出,在此基础上进行残差连接得到整个模块的输出; 所述步骤S2中,还包括: 步骤S20,块内特征处理步骤:块内改进的变换器处理模块对S个短块中的每个短块单独建模,即在Dr的第二个维度上展开特征学习,公式如下: 其中为块内子模块的输出,fr·为改进的Transformer编码器定义的映射函数; 步骤S21,块间特征处理步骤:块间改进的变换器处理模块在的最后一个维度上进行特征学习便可关联所有短块的信息,最后得到基于全局信息的输出: 其中为块间子模块的输出,hr·表示改进的Transformer编码器作用的映射函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。