杭州登虹科技有限公司杨程光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州登虹科技有限公司申请的专利一种基于ViT网络的人脸关键点检测模型的多阶段训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115311728B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211086101.6,技术领域涉及:G06V40/16;该发明授权一种基于ViT网络的人脸关键点检测模型的多阶段训练方法是由杨程光设计研发完成,并于2022-09-06向国家知识产权局提交的专利申请。
本一种基于ViT网络的人脸关键点检测模型的多阶段训练方法在说明书摘要公布了:本发明公开了一种基于ViT网络的人脸关键点检测模型的多阶段训练方法,步骤1,在ViT网络的基础上构建双分支训练结构,包括MAEMaskedAutoencoders无监督训练分支与人脸关键点检测监督训练分支;利用伪标签训练数据集对构建的训练结构进行一阶段的训练,步骤2,二阶段训练,去除步骤1中MAE无监督训练分支,保留人脸关键点监督训练分支,加载预训练模型权重并使用手工标注的人脸关键点数据集进行监督训练获得人脸关键点检测模型。本发明基于ViT网络的人脸关键点检测模型对不同场景特别是遮挡状态下的人脸关键点具有较好的检测效果,通过多阶段训练方法使得基于ViT网络的模型对标注数据的数据量要求减少,且易于向不同场景迁移。
本发明授权一种基于ViT网络的人脸关键点检测模型的多阶段训练方法在权利要求书中公布了:1.一种基于ViT网络的人脸关键点检测模型的多阶段训练方法,其特征在于,包括以下步骤: 步骤1,基于ViT网络构建双分支训练结构; S1、对于MAE无监督训练分支,在ViT网络后添加全连接层以及由Transformer块构成的解码器网络,解码器网络包含8个Transformer块,对于人脸关键点训练分支,在ViT网络后添加全局池化层以及多层感知器; S2、第一阶段的训练,利用伪标签数据集对双分支训练结构进行训练,其中伪标签数据集是采用PFLD人脸关键点检测模型对人脸图片进行预测构建的; S3、以训练的单次迭代过程为例,图片输入ViT网络前需经过图像块投影PatchEmbedding与位置编码,图像块投影即将输入图像进行子图Patch分割; S4、输出特征传入MAE无监督训练分支,首先输入通过全连接层改变特征维数,改变后的特征维数为DFC1,则全连接层输出的特征B×K×DFC1;输出的特征使用一个可学习的张量Token根据采用索引Indices进行填充变为B×Hh*Ww×DFC1,并重新进行位置编码后送入解码网络,解码网络输出的特征再经过全连接层并重新还原为B×H×W×3的图片张量,并与输入图像进行像素级的MSE损失计算,其中损失计算仅在未被采用的图像块进行; S5、输入特征传入人脸关键点检测监督训练分支,特征经过全局池化层以及多层感知器MLP,其中多层感知器包含两层全连接层,第一层全连接层为隐层,第二层全连接层为预测层,预测层输出张量为B×landmarks*2,其中landmarks为预测的人脸关键点数量,输出张量同标签进行Wing损失计算; 步骤2,仅保留监督训练分支的网络权重用于人脸关键点检测监督fine-tune训练;使用人工标注好的人脸关键点检测数据集对网络进行人脸关键点监督fine-tune训练,训练采用AdamW优化器,批大小为512,学习率为1e-4,采用余弦退火学习率下降策略,数据增强策略包括随机灰度化与随机颜色扰动; 在人工标注数据集上训练至模型收敛,经过迭代训练后获得训练完成的人脸关键点模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州登虹科技有限公司,其通讯地址为:310000 浙江省杭州市西湖区西斗门路3号天堂软件园A幢20楼A室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励