Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州相芯科技有限公司李冬平获国家专利权

杭州相芯科技有限公司李冬平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州相芯科技有限公司申请的专利一种实时动漫头像驱动方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116309986B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310082137.5,技术领域涉及:G06T13/40;该发明授权一种实时动漫头像驱动方法及系统是由李冬平;张昱升;毛卫柱设计研发完成,并于2023-02-08向国家知识产权局提交的专利申请。

一种实时动漫头像驱动方法及系统在说明书摘要公布了:本发明公开一种实时动漫头像驱动方法,属于图像处理技术领域;该方法包括:获取用户实时影像;对用户实时影像进行3DMM模型求解,得到目标表情向量和目标头部姿态向量;将目标表情向量进行语义映射,生成表情变化部分图;将目标头部姿态向量恒等映射到表情变化部分图中,生成三维重建影像,从而驱动头像。本发明还公开一种实时动漫头像驱动系统,本发明可以大规模制作高质量用于动漫头像驱动数据集,通过该方法生成数据集可以实现数据驱动的动漫人物头像驱动方法。本发明可以实现轻量级的移动端头像驱动。

本发明授权一种实时动漫头像驱动方法及系统在权利要求书中公布了:1.一种实时动漫头像驱动方法,其特征在于,包括以下步骤: 获取用户实时影像; 对用户实时影像进行3DMM模型求解,得到目标表情向量和目标头部姿态向量; 通过表情变化生成网络的identityencoder层从基础图像中提取出动漫人物的身份特征; 在最小分辨率时,表情变化生成网络的morphdecoder层使用多层MobileOneBlock结构;在分辨率增大之后,表情变化生成网络的morphdecoder层使用一层MobileOneBlock结构;表情变化生成网络的morphdecoder层将identityencoder层提取到的动漫人物的身份特征和目标表情向量作为输入,生成表情变化部分图; 根据表情变化损失函数计算误差,根据误差调整表情变化生成网络的morphdecoder层的模型参数; 所述表情变化生成网络包括identity encoder、morph decoder、表情变化损失函数; 所述identity encoder:身份特征提取网络重参数化之后网络结构是卷积层的堆叠,在每个尺度上都使用4个卷积层; 所述morph decoder:网络输入为身份特征和表情向量,输出一个mask以及表情变化部分图片,根据mask和原图进行alpha融合以增强时域稳定性,公式表示如下: Imorph=Imask*Ibase+1‑Imask*Imorph_gen式中:Imorph为表情变化生成网络最终生成图像,Ibase为自然表情图像,Imask为网络学习到的表情变化区域掩膜,Imorph_gen为网络生成的表情变化图像; 所述表情变化损失函数:表情变化损失函数使用重建损失、感知损失、对抗损失,总损失计算公式如下: LG_total=λrLr+λvggLvgg+λadvLG_adv其中重建损失Lr=||Imorph‑Igt||1,感知损失N=5,在VGG19中5个stage里分别选取一个ReLU之前的特征图上计算损失; 生成器的对抗损失LG_adv=DImorph‑12判别器的对抗损失LD_adv=DIgt‑12+DImorph2式中:LG_total为表情变化生成网络的总损失,Lr为重建损失,Lvgg为感知损失,LG_adv为对抗损失; λr、λvgg、λadv分别对应重建损失权重,感知损失权重,对抗损失权重; Imorph为表情变化生成网络最终生成图像,Igt为表情变化的GroundTruth图像; VGGi代表图像通过VGG网络提取得到的特征,VGGiIgt为GroundTruth图像提取到的特征,VGGiImorph为表情变化网络生成图像提取到的特征; D代表图像通过判别器得到的输出结果,DIgt为GroundTruth通过判别器得到的输出,DImorph为表情变化网络生成图像通过判别器得到的输出; 对表情变化部分图的像素点进行采样,再通过双线性插值算法生成重新采样图; 通过头部旋转生成网络的encoder层获取重新采样图的身份特征; 头部旋转生成网络的decoder层将encoder层获取到的重新采样图的身份特征和目标头部姿态向量作为输入,生成三维重建影像,从而驱动头像; 根据头部旋转损失函数计算误差,根据误差调整头部旋转生成网络的decoder层的模型参数; 所述头部旋转生成网络基于flow field方法,使用基于群体寻路算法flow field的方法,预测一个流场,然后使用双线性插值生成重新采样后的图片; 所述头部旋转生成网络的网络整体结构为:让网络隐式地学习需要修复的模板Imask和填充图片Iinpaint,并将其与根据预测流场重采样的结果Iwarp进行alpha融合;用公式表示如下: Irotate=Imask*Iwarp+1‑Imask*Iinpaint式中:Irotate为头部旋转网络生成最终图像,Imask为网络隐式学习到的修复掩膜,Iwarp为根据网络预测的流场对Imorph进行重采样生成的图像,Iinpaint为网络预测的进行修复的图像; 所述头部旋转生成网络的损失函数由四个部分构成,公式表示如下: Ltotal=λwarpLwarp+λrLr+λadvLadv+λinitLinit其中重建损失和对抗损失与表情变化网络相同;warp重采样图像的loss展开为在n个分辨率上gfieldi,Imorph代表通过fieldi重建的图像,相应的Igt_i代表Igt下采样到对应分辨率的结果; 初始化损失Linit用于在前期帮助网络收敛,init_fieldi为插值生成Imorph下采样到各分辨率的结果对应的流场,也即头部不旋转效果;λinit会随着训练中step增加而减小,达到预设的步数之后减小到0,其变化计算公式如下: λinit=1‑stepstep_end*weight_init式中: Ltotal训练中的总损失,为各损失的加权和; Lr为图像重建损失,计算公式为Lr=||Irotate‑Igt||1,其中Irotate为头部旋转网络的最终生成结果,Igt为头部旋转的GroundTruth图像; Lwarp基于流场方法重采样图像损失; Ladv为头部旋转生成网络的对抗损失Ladv=DIrotate‑12,对应判别器网络的对抗损失LD_adv=DIgt‑12+DIrotate2Linit为初始化流场损失,其中step为训练过程中当前迭代步数,step_end为希望初始化流场损失减小到0的迭代步数,weight_init为训练开始时初始化流场损失的初始权重,采用10.0; λr为图像重建损失权重,λwarp基于流场方法重采样图像损失权重,λadv对抗损失权重,λinit初始化流场损失权重。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州相芯科技有限公司,其通讯地址为:310000 浙江省杭州市滨江区滨安路1197号3幢436室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。