湖南工商大学姜林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南工商大学申请的专利一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115346555B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210967861.1,技术领域涉及:G10L25/51;该发明授权一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法是由姜林;陆伶琪设计研发完成,并于2022-08-12向国家知识产权局提交的专利申请。
本一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法在说明书摘要公布了:本发明公开了一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法。该方法包含训练和预测两部分,预测部分使用训练后的网络模型来完成带宽扩展任务,训练部分包括以下步骤:步骤1,数据预处理,对原始音乐数据集进行预处理,得到高频音乐信号和对应的低频音乐信号作为训练样本对;步骤2,设计模型架构,对步骤1的训练样本对进行训练,得到生成对抗网络模型,生成对抗网络模型包括用于生成样本数据的生成器和用于判别输入样本数据来源的多判别器。本发明在网络模型中加入多判别器,在一定程度上避免了扩展后的语谱图高频部分过于平滑的问题。
本发明授权一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法在权利要求书中公布了:1.一种基于听觉感知注意力生成对抗网络的音乐带宽扩展方法,包含训练和预测两部分,预测部分使用训练后的网络模型来完成带宽扩展任务,其特征在于,训练部分包括以下步骤:步骤1,数据预处理,对原始音乐数据集进行预处理,得到高频音乐信号和对应的低频音乐信号作为训练样本对; 步骤2,设计模型架构,对步骤1的训练样本对进行训练,得到生成对抗网络模型,生成对抗网络模型包括用于生成样本数据的生成器和用于判别输入样本数据来源的多判别器,生成器包括特征提取层、听觉感知注意力层、高频恢复层,特征提取层逐步缩小特征图的大小,提取出高级特征,听觉感知注意力层继续对提取出的高级特征进行处理,并从谐波注意力、帧间注意力和帧内注意力三个角度突出重要特征,保证生成音乐的听觉感知质量,高频恢复层将缩小后的特征图恢复成原始输入特征图的大小,最终输出扩展后的音乐信号; 其中,所述听觉感知注意力层的搭建包括从输入到最终输出的残差连接、一维卷积、分帧、合并、拼接以及谐波、帧间和帧内注意力机制,具体为:低频音乐信号输入到特征提取层后,得到特征张量,特征张量首先经过一个一维跨步卷积层,一维跨步卷积作用是继续将的特征图大小压缩到12,接着经过一个ReLU激活函数,在使用注意力机制之前,通过由一维卷积组成的三条路径,分别将通道大小调整为原来的13并向下取整,对于帧间和帧内注意力机制,还需要对特征张量进行分帧,将它们连接成三维张量,最后得到三个特征张量分量、、,将、、分别输入到谐波、帧间和帧内注意力机制中,得到谐波注意力的输出、帧间注意力的输出、帧内注意力的输出;对于和,先将其进行合并,该合并为分帧和连接的反操作,然后将它们与在通道维度进行拼接,再经过一个一维卷积,一维卷积的作用是得到与通道数相同的特征张量,最后添加一个残差连接使与相加,相加后再经过一个一维跨步卷积层和一个ReLU激活函数,恢复特征图大小使其与的特征图大小相同,得到听觉感知注意力的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南工商大学,其通讯地址为:410000 湖南省长沙市河西望城坡;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励