当前位置 : 首页 > 专利喜报 > 联通沃音乐文化有限公司李韩获国家专利权

联通沃音乐文化有限公司李韩获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉联通沃音乐文化有限公司申请的专利基于音频和图像的人脸伪造识别方法、装置、设备及介质获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN120356074B 。

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202510851017.6，技术领域涉及：G06V20/00；该发明授权基于音频和图像的人脸伪造识别方法、装置、设备及介质是由李韩;李胜宇;唐瑞;李地莲;张琳;唐涛涛设计研发完成，并于2025-06-24向国家知识产权局提交的专利申请。

本基于音频和图像的人脸伪造识别方法、装置、设备及介质在说明书摘要公布了：本发明提供了一种基于音频和图像的人脸伪造识别方法、装置、设备及介质，涉及人脸伪造识别技术领域，方法包括提取待识别的人脸视频数据中的图像数据和音频数据，构建全局图像；将全局图像输入至训练好的人脸伪造识别模型中，得到人脸伪造识别结果，其中，人脸伪造识别模型包括：全局特征编码器，用于提取全局图像中图像数据和音频数据的全局特征向量；全局区域编码器，用于构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合；区域感知模块，用于构建权重集合；特征融合模块，用于生成融合特征；多层感知机分类器，用于根据融合特征，输出人脸伪造识别结果。本发明以音频角度和图像角度进行人脸伪造识别，提升了识别的准确性。

本发明授权基于音频和图像的人脸伪造识别方法、装置、设备及介质在权利要求书中公布了：1.一种基于音频和图像的人脸伪造识别方法，其特征在于，包括：提取待识别的人脸视频数据中的图像数据和音频数据，构建全局图像；将所述全局图像输入至训练好的人脸伪造识别模型中，得到人脸伪造识别结果，其中，所述人脸伪造识别模型包括：全局特征编码器，用于根据自注意力机制，提取所述全局图像中所述图像数据和所述音频数据的全局特征向量，其中，所述全局特征向量为嘴唇运动与音频频率之间的对应关系，包括所述图像数据和所述音频数据之间的时序依赖信息，用于识别所述人脸视频数据中的不一致性与异常模式；全局区域编码器，用于将所述全局图像中的所述图像数据裁剪为头部区域图像、面部区域图像以及唇部特写图像，根据残差神经网络，分别提取所述头部区域图像的头部区域局部特征向量、所述面部区域图像的面部区域局部特征向量以及所述唇部特写图像的唇部特写局部特征向量，并分别将所述头部区域局部特征向量、所述面部区域局部特征向量以及所述唇部特写局部特征向量与所述全局特征向量拼接，构建头部区域特征集合、面部区域特征集合以及唇部特写特征集合；区域感知模块，用于通过全连接层和Sigmoid函数，分别提取所述头部区域特征集合的头部特征权重、所述面部区域特征集合的面部特征权重以及所述唇部特写特征集合的唇部特征权重，并构建权重集合；特征融合模块，用于根据所述权重集合，加权融合所述头部区域特征集合、所述面部区域特征集合以及所述唇部特写特征集合中的特征，生成融合特征；多层感知机分类器，用于根据所述融合特征，输出所述人脸伪造识别结果；所述提取待识别的人脸视频数据中的图像数据和音频数据，构建全局图像，包括：截取所述待识别的人脸视频数据中预设帧数的原始人脸图像，并裁剪所述原始人脸图像，生成无背景人脸图像；提取所述待识别的人脸视频数据中与所述预设帧数对应时间的音频数据，并将所述音频数据绘制成梅尔语谱图；拼接所述人脸图像和所述梅尔语谱图，构成所述全局图像。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人联通沃音乐文化有限公司，其通讯地址为：510000 广东省广州市黄埔区科学大道8号5栋201房5栋202房5栋203房5栋204房5栋205房；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

联通沃音乐文化有限公司李韩获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务