Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 陕西杰奇网络科技有限公司郝小斌获国家专利权

陕西杰奇网络科技有限公司郝小斌获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉陕西杰奇网络科技有限公司申请的专利冷启动驱动及主动学习机制相结合的数字人形象生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120833401B

龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511324476.5,技术领域涉及:G06T11/00;该发明授权冷启动驱动及主动学习机制相结合的数字人形象生成方法是由郝小斌;孔京设计研发完成,并于2025-09-17向国家知识产权局提交的专利申请。

冷启动驱动及主动学习机制相结合的数字人形象生成方法在说明书摘要公布了:本申请公开了一种冷启动驱动及主动学习机制相结合的数字人形象生成方法,本方案通过源于冷启动过程且具备高度个性化与动态适配性的预设少样本情感语音生成模型对输入数据进行处理,可以在大规模未标注输入数据上实现高效的个性化、多情感语音批量生成,从而输出高保真、情感与个性表达一致的目标音频文件;并且预设少样本情感语音生成模型是基于对候选训练样本利用第一冷启动质量评估器筛选后的第一合格样本训练得到的,使得能够在极少数据条件下启动,实现了在小样本条件下的高质量个性化数字人形象自动生成;另外,通过输入目标情感嵌入向量及目标性格特征向量,实现语音驱动下的表情同步生成,增强数字人自然交互能力与风格一致性。

本发明授权冷启动驱动及主动学习机制相结合的数字人形象生成方法在权利要求书中公布了:1.一种冷启动驱动及主动学习机制相结合的数字人形象生成方法,其特征在于,所述方法包括: 将目标数字人群、目标数字人群对应的目标文本内容、目标情感嵌入向量及目标性格特征向量输入至预设少样本情感语音生成模型中进行处理,生成所述目标数字人群中各目标数字人对应的目标音频文件;其中,所述目标音频文件与所述目标数字人的情感表达及性格表达一致;所述预设少样本情感语音生成模型是基于对候选联合性格情感的文本-语音对数据训练样本利用第一冷启动质量评估器筛选后的第一合格样本训练得到的;所述预设少样本情感语音生成模型的生成过程,包括: 将所述候选联合性格情感的文本-语音对数据训练样本输入至所述第一冷启动质量评估器中进行处理,通过第一预设评估公式计算得到第一综合质量分数;其中,所述第一预设评估公式是基于第一清晰度指标、情感一致性指标、第一多样性指标、第一异常置信度确定的;基于所述第一综合质量分数及第一预设筛选阈值,筛选得到所述第一合格样本,并对所述第一合格样本进行均衡采样,得到训练集和验证集;在所述训练集上,通过最大化预设训练目标对初始情感语音生成模型的参数进行更新,得到更新后的模型参数;其中,所述预设训练目标是基于语音数据对应的梅尔频谱图、文本数据、情感嵌入向量及性格特征向量确定的,所述初始情感语音生成模型是基于Tacotron2的条件语音合成模型及条件变分自编码器机制构建得到的,所述条件变分自编码器机制将所述情感嵌入向量及性格特征向量进行融合后作为条件变量进行输入;在所述验证集上,通过计算验证损失对所述更新后的模型参数进行验证,并通过回传梯度得到目标模型参数;基于所述目标模型参数,生成所述预设少样本情感语音生成模型; 所述将所述候选联合性格情感的文本-语音对数据训练样本输入至所述第一冷启动质量评估器中进行处理,通过第一预设评估公式计算得到第一综合质量分数,包括: 将所述候选联合性格情感的文本-语音对数据训练样本输入至所述第一冷启动质量评估器中,获取所述候选联合性格情感的文本-语音对数据训练样本对应的信噪比、语音感知质量评分及语音可懂度指标,基于所述信噪比、语音感知质量评分及语音可懂度指标计算得到所述第一清晰度指标;基于所述候选联合性格情感的文本-语音对数据训练样本对应的情感梅尔频谱图得到预测情绪分布,基于所述预测情绪分布及预设情绪标签的相似度计算得到所述情感一致性指标;基于各所述候选联合性格情感的文本-语音对数据训练样本之间的距离,计算得到所述第一多样性指标;基于所述情感梅尔频谱图及所述预设情绪标签计算得到所述候选联合性格情感的文本-语音对数据训练样本为异常生成的第一概率,基于所述第一概率得到所述第一异常置信度;基于所述第一清晰度指标、所述情感一致性指标、所述第一多样性指标及所述第一异常置信度,计算得到所述第一综合质量分数; 将所述目标音频文件、所述目标情感嵌入向量及目标性格特征向量输入至预设数字人形象生成模型中进行处理,生成各所述目标数字人对应的目标形象;其中,所述目标形象用于反映与所述目标音频文件中的所述情感表达及性格表达一致的面部状态;所述预设数字人形象生成模型是基于条件生成对抗网络为基础构建得到的,所述预设数字人形象生成模型包括表情控制器模块、性格调节器模块、条件自适配器模块、图像生成器模块、冷启动质量评估与回放模块。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人陕西杰奇网络科技有限公司,其通讯地址为:710000 陕西省西安市高新区高新二路9号千人楼蒜泥空间A30;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。