中国人民解放军国防科技大学叶健彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利基于跨模态掩码建模的深度伪造检测方法、装置和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119202989B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411286789.1,技术领域涉及:G06F18/2433;该发明授权基于跨模态掩码建模的深度伪造检测方法、装置和设备是由叶健彬;肖曼;许可乐;刘波;马行空;洪学恕;陈旺群;蔡依青;刘姝含设计研发完成,并于2024-09-13向国家知识产权局提交的专利申请。
本基于跨模态掩码建模的深度伪造检测方法、装置和设备在说明书摘要公布了:本申请涉及一种基于跨模态掩码建模的深度伪造检测方法、装置和设备。所述方法包括:构建包括多模态掩码建模模块、跨注意力融合模块和对比学习模块的深度伪造检测模型;综合音视频重建损失和音视频对比学习损失对深度伪造检测模型进行训练优化;将待检测音视频序列输入训练好的深度伪造检测模型,根据模型输出得到待检测的音视频跨注意力编码特征,通过将待检测的音视频跨注意力编码特征输入分类器进行音视频匹配相关检测,输出得到音视频序列的伪造检测结果。采用本方法能够利用掩码建模技术来学习真实视频的表征以及将视听模态的特征进行交叉融合和对比学习从而提高伪造检测性能。
本发明授权基于跨模态掩码建模的深度伪造检测方法、装置和设备在权利要求书中公布了:1.一种基于跨模态掩码建模的深度伪造检测方法,其特征在于,所述方法包括: 构建包括多模态掩码建模模块、跨注意力融合模块和对比学习模块的深度伪造检测模型;其中,所述多模态掩码建模模块用于提取音视频序列中的视频模态与音频模态,并分别针对所述视频模态与音频模态依次进行切分、掩码建模、位置编码和特征编码处理,输出得到均由编码类令牌和编码特征组成的视频特征和音频特征;所述跨注意力融合模块用于融合所述视频特征和音频特征中的编码特征得到融合编码特征,基于所述融合编码特征进行跨注意力建模,并将建模得到的视频跨注意力编码特征和音频跨注意力编码特征进行特征解码,输出得到音视频重建结果;所述对比学习模块用于融合所述视频特征和音频特征中的编码类令牌得到互信息矩阵,并基于所述互信息矩阵计算得到音视频相似度; 根据所述跨注意力融合模块输出的音视频重建结果构建音视频重建损失,根据所述对比学习模块输出的音视频相似度构建音视频对比学习损失,综合所述音视频重建损失和音视频对比学习损失对所述深度伪造检测模型进行训练优化,直至得到训练好的深度伪造检测模型; 将待检测音视频序列输入训练好的深度伪造检测模型,根据模型中的多模态掩码建模模块提取待检测的音视频编码特征,根据跨注意力融合模块融合所述待检测的音视频编码特征并进行跨注意力建模,输出得到待检测的音视频跨注意力编码特征,通过将所述待检测的音视频跨注意力编码特征输入分类器进行音视频匹配相关检测,输出得到音视频序列的伪造检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励