苏州工学院胡益凡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州工学院申请的专利一种基于多模态融合的古琴演奏动作与音频同步分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120635654B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511121803.7,技术领域涉及:G06V10/80;该发明授权一种基于多模态融合的古琴演奏动作与音频同步分析方法是由胡益凡;月东晓;林友设计研发完成,并于2025-08-12向国家知识产权局提交的专利申请。
本一种基于多模态融合的古琴演奏动作与音频同步分析方法在说明书摘要公布了:本发明提供一种基于多模态融合的古琴演奏动作与音频同步分析方法,属于古琴演奏分析技术领域,其可至少部分解决现有的古琴教学、表演与数字化中依赖单一模态分析,仅音频或仅视频,难以全面捕捉演奏细节,在特征提取与融合方面,无法充分挖掘不同模态特征之间的复杂关联关系的问题。本发明包括以下步骤:通过计算机视觉技术分析古琴演奏视频;采用三级融合策略,在数据层将视觉帧和音频频谱结合。本发明的一个技术效果在于,通过多模态融合,结合视觉与音频数据,实现了更全面的演奏分析。同时,针对现有技术中固定阈值判断同步性的不足,引入自适应阈值调整,根据演奏特征动态优化判断标准,提高了同步性判断的准确性和适应性。
本发明授权一种基于多模态融合的古琴演奏动作与音频同步分析方法在权利要求书中公布了:1.一种基于多模态融合的古琴演奏动作与音频同步分析方法,其特征在于,包括以下步骤: 步骤S100:通过计算机视觉技术分析古琴演奏视频,提取手部动作、指法变化和触弦位置的信息;同时,利用音频处理算法从演奏录音中提取音高、节奏和音色特征;上述视觉和音频两种模态的数据经过时间对齐,确保动作和音频的时序一致性; 步骤S200:采用三级融合策略,在数据层将视觉帧和音频频谱结合,让模型学习所述视觉帧和音频频谱的关联特征,并在所述模型的特征层利用注意力机制,使得所述模型自动关注手部动作和对应音符的匹配关系,以及在所述模型的决策层根据视觉和音频的预测结果,判断演奏是否同步,并识别演奏动作与音频的对应关系; 步骤S300:引入自适应同步性判断,计算所述演奏动作和音频之间的时间偏差,根据所述时间偏差,判断是否超过设定阈值,从而检测不同步的演奏片段,所述不同步的演奏片段包括有延迟和误触弦,基于正确演奏样本和错误演奏样本的对比分析,对所述模型进行训练和参数更新,以优化其同步性判断能力,并生成反馈建议,帮助演奏者调整指法和节奏,提升演奏准确性; 其中,所述自适应同步性判断进一步包括: 设为第个演奏片段的时间差,和分别为所有时间差的均值和标准差,自适应阈值可以表示为: ; 其中,是一个可调节的参数,用于控制阈值的严格性,是演奏片段的总数,同步性判断可以表示为: 同步=。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州工学院,其通讯地址为:215500 江苏省苏州市常熟市南三环路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励