当前位置 : 首页 > 专利喜报 > 北京邮电大学周琳娜获国家专利权

北京邮电大学周琳娜获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉北京邮电大学申请的专利一种基于音视频多模态的特定人物深度伪造检测方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN115661889B 。

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202211185641.X，技术领域涉及：G06V40/16；该发明授权一种基于音视频多模态的特定人物深度伪造检测方法是由周琳娜;杨震;储贝林;毛羽哲;王任颖;林清然;陈贤浩设计研发完成，并于2022-09-27向国家知识产权局提交的专利申请。

本一种基于音视频多模态的特定人物深度伪造检测方法在说明书摘要公布了：本发明公开一种基于音视频多模态的特定人物深度伪造检测方法，属于安全与数字图像取证领域，采用音视频多模态融合的算法，并结合唇读方法基于时序捕捉人脸的动态特征。本发明的步骤有：1提取人物音视频与唇读特征；2融合唇部与时序特征为面部语义特征；3融合面部语义特征与音频特征进入神经网络；3融合特征在分类器中进行真假脸的检测。本发明方法以融合音视频多模态的神经网络模型为基础，针对特定人物的AI换脸检测进行创新设计，满足对于指定人物检测高准确率的要求。同时，本发明方法通过提取面部时序信息捕捉人脸动态特征，参考时间维度不同人脸的平移旋转等动作，弥补了原本仅限于参考图像内容本身的特征的局限，极大提高了假脸检测的准确性。

本发明授权一种基于音视频多模态的特定人物深度伪造检测方法在权利要求书中公布了：1.基于音视频多模态的特定人物深度伪造检测方法，其特征在于：首先，提取目标人物面部及音频的数据集，得到全部正负样本中目标人物音频与唇读特征，具体为： A、逐帧检测视频中目标人物面部关键点坐标信息，根据提取的坐标信息，提取面部运动单元强度Fface； B、唇部运动时序特征抽取；检测所有正负样本的68个关键点中的唇部关键点，提取唇部运动特征Flip； C、音频时序特征抽取；将视频中的音频转化为频域信息，而后将频域信息转换为512维的梅尔倒谱系数作为音频特征Fmel；进一步，将Fface和Flip融合为面部语义特征Fimg；面部语义特征融合方法为：通过特征矩阵的横向拼接，将Fface和Flip融合为面部语义特征：式中，代表矩阵横向拼接；进一步，采用纵向拼接的方式，将面部语义特征Fimg与音频特征Fmel融合，得到融合特征F： F＝[Fimg,Fmel] 上式中，[·,·]代表矩阵纵向拼接；最后，将融合特征F在分类器中进行真假脸的检测，分类器中，首先通过两层全连接的前馈神经网络层进行融合特征数据降维，然后对降维后的特征数据使用softmax层收缩至2维，进行二分类。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人北京邮电大学，其通讯地址为：100876 北京市海淀区西土城路10号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

北京邮电大学周琳娜获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务