Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京信息工程大学孙玉宝获国家专利权

南京信息工程大学孙玉宝获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京信息工程大学申请的专利一种基于3DGS的高保真语音驱动数字人合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119991888B

龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510457933.1,技术领域涉及:G06T13/20;该发明授权一种基于3DGS的高保真语音驱动数字人合成方法是由孙玉宝;施宇城;易宸宇;刘佳设计研发完成,并于2025-04-14向国家知识产权局提交的专利申请。

一种基于3DGS的高保真语音驱动数字人合成方法在说明书摘要公布了:本发明公开了一种基于3DGS的高保真语音驱动数字人合成方法,首先,训练静态数字人模型,基于3DGaussianSplatting构建,并用空间判别器提升图像质量,捕捉数字人基础形状和外观。随后,训练动态驱动网络,包含可优化全局提示、渐进式条件属性预测网络模块和双重判别器架构,其中,可优化全局提示模块用于稳定数字人面部几何结构,防止动画过程中的漂移;渐进式条件属性预测网络模块用于高效且时序连贯地预测数字人模型的动态高斯参数;双判别器架构模块用于提升合成数字人动画的真实感和时间一致性。本发明适用于语音驱动的数字人动画合成,能够有效提升合成数字人动画的真实感、效率和结构连贯性,并实现实时渲染。

本发明授权一种基于3DGS的高保真语音驱动数字人合成方法在权利要求书中公布了:1.一种基于3DGS的高保真语音驱动数字人合成方法,其特征在于,执行如下步骤S1-步骤S3,生成通过语音信号驱动的数字人动画: 步骤S1:针对数字人进行特征编码和静态高斯参数预测,构建静态数字人模型,对静态数字人模型采用3DGaussianSplatting软件捕捉并渲染数字人的基础形状和外观,采用反向传播方法训练静态数字人模型,获得训练好的静态数字人模型; 步骤S2:构建并训练语音驱动数字人合成系统,包含可优化全局提示模块、渐进式条件属性预测网络模块和双判别器架构模块;其中可优化全局提示模块生成全局提示,渐进式条件属性预测网络模块以音频信号、表情参数、视角参数,以及全局提示为输入,分阶段预测动态形变,将动态形变与静态数字人模型相结合,获得动态数字人模型,双判别器架构模块判别动态数字人模型与真实动态人脸图像; 具体步骤如下: 步骤S2.1:将音频信号a、经过处理的表情特征e、视角特征v及可优化的全局提示输入渐进式条件属性预测网络模块,分阶段预测动态形变;其中为全局位置偏移量、为尺度变化量、为旋转调整量、为不透明度值变化量、为球谐系数变化量; 步骤S2.2:将动态形变与训练好的静态数字人模型相结合,获得动态高斯参数,为平均位置、为平均尺度、为平均旋转、为平均球谐系数,为平均不透明度值;动态高斯参数构成动态数字人模型; 步骤S2.3:利用3DGaussianSplatting软件,基于动态高斯参数渲染生成合成动态人脸图像序列; 步骤S2.4:将合成动态人脸图像序列和真实动态人脸图像序列分别输入双判别器架构模块,双判别器架构模块包括空间判别器和时间判别器,获得空间判别器和时间判别器输出的判别结果; 步骤S2.5:基于判别结果以及合成动态人脸图像序列与真实动态人脸图像序列之间的动态损失函数,反向传播优化训练渐进式条件属性预测网络模块、可优化全局提示模块和双判别器架构模块,获得训练好的语音驱动数字人合成系统; 步骤S3:将语音信号输入到训练好的语音驱动数字人合成系统中,输出语音驱动的数字人动画,完成数字人动画的合成。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京信息工程大学,其通讯地址为:210032 江苏省南京市江北新区宁六路219号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。