Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 复旦大学李伟获国家专利权

复旦大学李伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉复旦大学申请的专利基于跨模态融合的音乐情感识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116010902B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310058201.6,技术领域涉及:G06F18/25;该发明授权基于跨模态融合的音乐情感识别方法及系统是由李伟;赵嘉豪;茹港徽;吴宇伦设计研发完成,并于2023-01-16向国家知识产权局提交的专利申请。

基于跨模态融合的音乐情感识别方法及系统在说明书摘要公布了:本发明属于音乐情感识别技术领域,具体为一种基于跨模态融合的音乐情感识别方法及系统。本发明方法包括获取待识别音乐的音乐信息;提取音乐信息的音乐情感特征;对音乐情感特征进行预处理,得到具有位置编码的特征融合序列;将特征融合序列输入到TransformerEncoder,得到融合后的音乐情感特征;将融合后的音乐情感特征输入预训练的全连接分类器,得到预测的音乐情感类别。本发明能够提高音乐情感识别的精度。

本发明授权基于跨模态融合的音乐情感识别方法及系统在权利要求书中公布了:1.一种基于跨模态融合的音乐情感识别方法,其特征在于,具体步骤如下: (1)获取待识别音乐的音乐信息;所述音乐信息包括音频文件、歌词、歌名、歌手名、专辑名和专辑封面; (2)提取所述音乐信息的音乐情感特征;所述音乐情感特征包括音频特征、文本特征和图像特征;所述音频特征为所述音频文件的特征;所述文本特征包括所述歌词、所述歌名、所述歌手名和所述专辑名的特征;所述图像特征为所述专辑封面的特征; (3)对所述音乐情感特征进行预处理,得到具有位置编码的特征融合序列; (4)将所述特征融合序列输入预训练的TransformerEncoder,得到融合后的音乐情感特征; (5)将所述融合后的音乐情感特征输入预训练的全连接分类器,得到预测的音乐情感类别;所述音乐情感类别包括高兴、难过、生气和放松; 步骤(2)所述提取所述音乐信息的音乐情感特征,具体包括: 计算所述音频文件的梅尔频谱; 将所述梅尔频谱的频谱图的尺寸调整到预设尺寸; 将调整后的频谱图输入预训练的2D-CNN模型进行音频特征提取,得到音频特征; 所述2D-CNN2-DimensionalConvolutionalNeuralNetwork,二维卷积神经网络包括卷积层和池化层;所述卷积层包括第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层;所述池化层包括第一池化层、第二池化层、第三池化层、第四池化层和第五池化层; 所述第一卷积层、所述第一池化层、所述第二卷积层、所述第二池化层、所述第三卷积层、所述第三池化层、所述第四卷积层、所述第四池化层、所述第五卷积层和所述第五池化层依次连接; 所述卷积层的卷积核尺寸均为3*3;所述池化层的池化窗口尺寸均为2*2; 将所述歌词、所述歌名、所述歌手名和所述专辑名进行拼接,得到拼接文本; 计算拼接文本的词嵌入表示; 将所述词嵌入表示输入预训练的BERT模型,得到文本特征; 将所述专辑封面输入预训练的Resnet50模型,得到图像特征; 步骤(3)所述对所述音乐情感特征进行预处理,得到具有位置编码的特征融合序列,具体包括: 将所述音乐情感特征转换为一维向量; 将转换为一维向量的音乐情感特征进行切分,得到片段等长的特征序列; 对所述片段等长的特征序列中的片段进行位置编码,得到具有位置编码的特征融合序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。