武汉大学谢榕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利一种语音驱动的人脸动画生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115457169B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211005678.X,技术领域涉及:G06T13/20;该发明授权一种语音驱动的人脸动画生成方法及系统是由谢榕;李耀鹏设计研发完成,并于2022-08-22向国家知识产权局提交的专利申请。
本一种语音驱动的人脸动画生成方法及系统在说明书摘要公布了:本发明提供一种语音驱动的人脸动画生成方法及系统,进行人脸关键点提取及标准化,以唇部为主要参照,利用眼睛与嘴唇的位置关系,对人脸关键点进行几何位置纠正;从音频特征中预测唇部关键点,包括音频特征提取、数据预处理、Audio2MKP建模与训练及参数优化,Audio2MKP是实现从语音到唇部关键点的映射的模型;基于唇部关键点的参照图像生成,包括遮罩图像生成、人脸区域划分、FTGAN建模与训练,以及参数优化,FTGAN是实现将人脸遮罩图像转换为人脸参照图像的模型;在参照图像基础上,利用音频特征来指导人脸动画的生成,包括A2FGAN建模与训练、参数优化,以及人脸动画合成,A2FGAN是实现获得唇音同步效果的人脸动画的模型。
本发明授权一种语音驱动的人脸动画生成方法及系统在权利要求书中公布了:1.一种语音驱动的人脸动画生成方法,其特征在于:包括通过以下步骤进行人脸动画自动生成, 步骤S1,人脸关键点提取及标准化,其中人脸关键点标准化处理包括以唇部为主要参照,利用眼睛与嘴唇的位置关系,对人脸关键点进行几何位置纠正; 步骤S2,从音频特征中预测唇部关键点,包括音频特征提取、数据预处理、唇部关键点预测模型Audio2MKP建模与训练,以及唇部关键点预测模型Audio2MKP参数优化;所述唇部关键点预测模型Audio2MKP是实现从语音到唇部关键点的映射的模型; 步骤S3,基于唇部关键点的参照图像生成,包括遮罩图像生成、人脸区域划分、人脸转换生成对抗网络模型FTGAN建模与训练,以及人脸转换生成对抗网络模型FTGAN参数优化;所述人脸转换生成对抗网络模型FTGAN是实现将人脸遮罩图像转换为人脸参照图像的模型; 基于生成对抗网络的架构改进建立人脸转换生成对抗网络模型FTGAN,将人脸遮罩图像转换为人脸参照图像,实现方式包括以下步骤, 1FTGAN建模,包括基于所述人脸转换生成对抗网络模型FTGAN实现将预测唇部关键点得到的遮罩图像转换为人脸参照图像;所述人脸转换生成对抗网络模型FTGAN由一个生成器网络和一个判别器网络组成,所述生成器网络接收输入的遮罩图像产生输出人脸参照图像,其中STN模块、人脸编码器模块、CBAM模块和人脸编码器模块依次连接;判别器网络中包括帧判别器模块,生成器网络生成的参照图像以及对应的真值图像一起输入到帧判别器模块,计算生成标签与真值标签之间均方误差以评价生成图像优劣; 2FTGAN训练,接收输入的遮罩图像,对人脸转换生成对抗网络模型FTGAN进行训练,通过反向传播优化模型参数,获得高质量的人脸参照图像; 步骤S4,在步骤S3获得的参照图像基础上,并利用步骤S2获得的音频特征来指导人脸动画的生成,包括语音到人脸生成对抗网络A2FGAN建模与训练、语音到人脸生成对抗网络A2FGAN参数优化,以及人脸动画合成;所述语音到人脸生成对抗网络A2FGAN是实现获得唇音同步效果的人脸动画的模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区珞珈山街道八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励