深圳华科瑞雪智能科技有限公司王晓卓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳华科瑞雪智能科技有限公司申请的专利一种基于人工智能的交互式数字人生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119600159B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411647512.7,技术领域涉及:G06T13/40;该发明授权一种基于人工智能的交互式数字人生成方法及系统是由王晓卓设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本一种基于人工智能的交互式数字人生成方法及系统在说明书摘要公布了:本发明涉及一种基于人工智能的交互式数字人生成方法,包括以下步骤:通过条件向量定义数字人的基本特征和生成要求,使用编码器生成潜在空间表示,解码器生成初步图像,结合风格迁移技术调整图像以适应目标环境,使用超分辨率网络提升分辨率与细节,最终生成静态数字人形象。收集多模态数据,通过融合函数整合特征生成统一表示。基于条件向量、随机噪声和多模态统一特征,生成与情绪或状态相符的表情和语音表现。通过识别用户情绪,为数字人的表情和语音反应提供依据。以反应函数生成实时响应,结合增强学习优化行为和响应策略,实现更准确和智能的交互。可生成高质量的个性化数字人形象,并通过多模态交互和情绪感知实现智能化响应。
本发明授权一种基于人工智能的交互式数字人生成方法及系统在权利要求书中公布了:1.一种基于人工智能的交互式数字人生成方法,其特征在于,包括以下步骤: 数字人形象生成步骤:定义数字人的输入条件,输入条件通过一个条件向量表示,描述数字人的基本特征和生成要求;将条件向量输入编码器,生成潜在空间表示,将采样的潜在向量通过解码器,生成初步数字人图像,使用重构损失保证生成的图像符合输入条件的特性,使用KL散度确保潜在空间分布的连续性,在初步生成的数字人图像基础上,应用风格迁移技术使其适应目标环境或风格,使用超分辨率网络提高图像的分辨率和细节质量,并输出高分辨率图像最终形象; 数字人行为生成步骤:收集多模态数据,并转换成相应的特征向量集合,所述多模态数据包括面部表情、语音及身体动作;构建一个融合函数,所述融合函数用于将特征向量集合中的多种特征向量整合成一个统一的特征表示,融合函数为多层神经网络,通过神经网络中的权重矩阵将不同模态的数据映射到统一的特征空间;定义一个损失函数,用于评估生成的数字人行为与预设目标之间的差异;通过优化算法调整损失函数参数,以最小化损失函数值,所述优化算法包括采用随机梯度下降或Adam算法; 数字人表现生成步骤:设定一个条件向量,代表特定的情绪或状态;通过生成器,接收随机噪声、条件向量和多模态数据的统一特征表示,生成与所设定情绪或状态相对应的面部表情或语音数据;使用判别器来评估生成的数据和条件向量的匹配度,并判断其真实性;通过最小化对抗损失函数优化生成器和判别器,以提高生成数据的真实性和匹配度,并构建得到表现数据合成器; 数字人情绪识别步骤:获取用户的面部图像,使用预训练的卷积神经网络模型从用户面部图像中提取特征;将提取的特征向量输入到分类器,以识别用户的具体表情,所述分类器为支持向量机或多层感知机;根据识别的表情类别,数字人生成的相应面部表情或语音反应; 数字人响应优化步骤:接收用户的输入信息,所述输入信息包括语音指令或文字信息;通过预设的反应函数,处理用户输入并生成相应的响应;通过反馈调整反应函数的参数,以确保响应的准确性和及时性; 在数字人响应优化步骤中,用户的输入数据在时间t发生,其中为语音指令或文字信息,表示为;使用反应函数R生成数字人的响应,反应函数R表示为:,其中,是反应函数的参数,反应函数的参数通过训练数据得到优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳华科瑞雪智能科技有限公司,其通讯地址为:518000 广东省深圳市龙华区龙华街道富康社区油松路梦丽园工业区7栋4层421;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励