Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南理工大学黄双萍获国家专利权

华南理工大学黄双萍获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南理工大学申请的专利一种基于三维时序表征学习的说话头像生成优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120298586B

龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510359623.6,技术领域涉及:G06T17/00;该发明授权一种基于三维时序表征学习的说话头像生成优化方法是由黄双萍;陈浩;黄逸宁;李豪杰;郝子钰设计研发完成,并于2025-03-25向国家知识产权局提交的专利申请。

一种基于三维时序表征学习的说话头像生成优化方法在说明书摘要公布了:本发明公开了一种基于三维时序表征学习的说话头像生成优化方法,包括:基于三维形变模型构建面部几何网格,提取说话头像视频的三维唇部运动信息;将三维唇部运动信息作为输入,通过重建网格三维序列构建蕴含三维时序信息的隐式空间,得到重建导向型三维时序表征学习算法;将三维唇部运动信息作为输入,利用序列数据增强策略与对比学习机制,得到对比增强型三维时序表征学习算法;采用说话头像生成模型生成说话头像视频,利用三维时序表征学习算法对其进行表征编码,基于三维唇部运动信息和三维时序表征构建监督信号增强模型生成的唇部动态真实性,通过三维几何空间建模与跨模态监督的方式,提升了说话头像视频的视觉真实性与音画同步精度。

本发明授权一种基于三维时序表征学习的说话头像生成优化方法在权利要求书中公布了:1.一种基于三维时序表征学习的说话头像生成优化方法,其特征在于,包括以下步骤: 步骤1,基于三维形变模型构建面部几何网格,提取说话头像视频的三维唇部运动信息; 步骤2,将三维唇部运动信息作为输入,通过重建网格三维序列构建蕴含三维时序信息的隐式空间,得到重建导向型三维时序表征学习算法; 步骤3,将三维唇部运动信息作为输入,利用序列数据增强策略与对比学习机制,得到对比增强型三维时序表征学习算法; 步骤4,采用说话头像生成模型生成说话头像视频,利用三维时序表征学习算法对其进行表征编码,基于三维唇部运动信息和三维时序表征构建监督信号增强模型生成的唇部动态真实性, 步骤2中,将三维唇部运动信息作为输入,通过重建三维网格序列构建蕴含三维唇部时序数据的隐式空间,得到重建导向型三维时序表征学习算法,包括以下步骤: 步骤2.1,构建由Transformer编码器、可学习码本和Transformer解码器组成的矢量量化变分自Transformer编码器作为重构引导的三维时序表征学习算法的架构; 步骤2.2,遍历每个三维唇部网格序列,通过Transformer编码器沿时间轴提取序列信息,映射为潜在向量,其中; 步骤2.3,将潜在向量与可学习码本中最相似的嵌入向量进行匹配,得到重建导向型三维时序表征,其中表示三维时序表征的特征维度; 步骤2.4,将导向型三维时序表征输入Transformer解码器重构三维唇部网格序列,通过多目标损失函数联合优化导向型三维时序表征学习算法,增强算法对唇部几何运动信息的捕获能力, 步骤2.4中,通过多目标损失函数联合优化导向型三维时序表征学习算法,包括以下步骤: 步骤2.4.1,约束Transformer解码器重构的三维唇部网格序列与原始输入的三维唇部网格序列的几何一致性: ; 优化可学习码本中的嵌入向量,使其与Transformer编码器输出的潜在向量对齐: ; 其中表示梯度停止操作,迫使Transformer编码器输出的潜在向量与可学习码本的嵌入向量之间的对齐优化仅为单向性,避免参数迭代的冲突; 步骤2.4.2,约束Transformer编码器输出的潜在向量,减少量化误差,通过调整参数平衡目标损失的贡献: ; 将总体损失反向传递给导向型三维时序表征学习算法,通过梯度计算迭代参数使总体损失最小化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510000 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。