南京大学沈勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利一种基于联邦迁移学习的音视频匹配方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740450B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310726324.2,技术领域涉及:G06V10/764;该发明授权一种基于联邦迁移学习的音视频匹配方法及系统是由沈勇;刘天宇;孙戈非;冯雪磊;刘紫赟设计研发完成,并于2023-06-19向国家知识产权局提交的专利申请。
本一种基于联邦迁移学习的音视频匹配方法及系统在说明书摘要公布了:一种基于联邦迁移学习的音视频匹配方法及系统,本发明所述方法基于大量情感数据,训练出预训练模型,个人用户在预训练模型上基于联邦迁移学习,使用少量个人数据,即可获得适用于自己需求的音视频匹配模型。本发明训练过程中数据隔离,解决了音视频匹配中可能存在的数据泄露风险,保障了用户的版权和隐私。同时保证了模型的质量无损传输,不会出现负迁移。
本发明授权一种基于联邦迁移学习的音视频匹配方法及系统在权利要求书中公布了:1.一种基于联邦迁移学习的音视频匹配方法,其特征在于,包括: 步骤1,数据预处理,对音频视频分别进行预处理,将音频转换成频谱图,视频则转换成16个图层的RGB图像; 步骤2,构建神经网络模型,音频网络主体为Resnet18;视频网络主体为3D-Resnet50; 步骤3,使用交叉熵损失进行分类任务训练,得到预训练联邦模型参数; 使用batch_size=64训练预训练模型参数,batch中32个样本为音频输入,32个样本为视频输入,基于步骤2中的网络结构进行前向传播后,得到32x256的音频特征向量,以及32x256的视频特征向量,在batch维度进行拼接,得到64x256的融合特征向量;通过计算数据标签结果和融合特征向量的交叉熵损失,更新网络权重,得到预训练模型参数,设N为batch_size;M为类别标签数量;为符号函数,当样本的类别标签为c则,反之;表述网络输出的概率值,则损失函数L的表达式为: ; 为总的采样点数; 步骤4,用户从服务器下载预训练联邦模型参数到本地,基于本地数据对预训练联邦模型参数进行前向传播得到梯度,将梯度进行加密回传; 步骤5,服务器基于客户端返回的梯度结果更新模型参数; 步骤6,用户从服务器上下载更新后的模型,重复步骤4和步骤5,直到达到用户预设的迭代次数,完成模型训练; 步骤7,使用训练好的模型进行音视频跨模态匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励