Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 哈尔滨工业大学;哈工大郑州研究院金晶获国家专利权

哈尔滨工业大学;哈工大郑州研究院金晶获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉哈尔滨工业大学;哈工大郑州研究院申请的专利一种数字冰壶运动员面部表情的语音驱动方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119359873B

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411564299.3,技术领域涉及:G06T13/40;该发明授权一种数字冰壶运动员面部表情的语音驱动方法是由金晶;王纪龙;姜宇;李丹丹设计研发完成,并于2024-11-05向国家知识产权局提交的专利申请。

一种数字冰壶运动员面部表情的语音驱动方法在说明书摘要公布了:本发明提出一种数字冰壶运动员面部表情的语音驱动方法。所述方法基于冰壶比赛视频建立冰壶运动员的数字人形象,并建立冰壶运动员的个性化情绪参数库,使用神经网络模型将冰壶比赛音频转换为个性化表情参数,将个性化表情参数转换为三维人脸动画,实现个性化的数字人语音驱动。数字冰壶运动员的建模过程考虑运动员的个性化特征,如面部特征、表情特点等,同时在数字人开发中仅使用比赛视频建模,并实现基于语音的在线驱动,有助于开发者在数字人开发中快速地实现个性化定制,满足不同用户或场景的需求。

本发明授权一种数字冰壶运动员面部表情的语音驱动方法在权利要求书中公布了:1.一种数字冰壶运动员面部表情的语音驱动方法,其特征在于,所述方法包括以下步骤: 步骤1:基于冰壶比赛视频建立冰壶运动员的数字人形象;通过多视角三维重建方法得到冰壶运动员的含纹理贴图的面部三维模型,并建立具有完整骨骼和面部控制参数的数字人模板,将其与面部三维模型进行对齐,校准骨骼点和面部控制参数,得到具有本人特征的数字冰壶运动员面部形象; 步骤2:通过冰壶比赛视频建立冰壶运动员的个性化情绪参数库;基于神经网络模型从冰壶运动员的喊话中学习情绪向量,在神经网络模型中进行情绪向量的学习和输出,将冰壶运动员在表达和喊话时的个性化表情特征和情绪特征单独提取、训练和推理; 步骤3:使用神经网络模型从冰壶比赛音频中学习表情参数,将步骤2得到的情绪向量与个性化情绪参数库中的数据结合,与表情参数叠加,将冰壶比赛音频转换为个性化表情参数,实现面部表情的在线语音驱动方法,将个性化表情参数转换为三维人脸动画,实现个性化的数字人语音驱动; 在步骤2中,基于冰壶比赛视频采集冰壶运动员喊话“快速擦冰”、“停止擦冰”、“几秒几”、“下线”、“顶线”、“低声细语”6种情况下存在的“愉快”、“悲伤”、“害怕”、“恐惧”、“惊喜”、“生气”和“嫌恶”的情绪图片,并将每种情绪都分为“舒缓”和“强烈”两类; 在步骤2中,建立个性化情绪参数库具体为:对冰壶比赛视频中的每帧图片检测68个关键点集{P1,P2,P3…P68},使用eos库重建冰壶运动员面部表情,针对关键点进行拟合得到面部表情的Blendshape参数值,将每个情绪的Blendshape参数值取平均值,即为冰壶运动员在此情绪下的参数,将所有的情绪参数保存,得到个性化情绪参数库; 在步骤2中,构建神经网络模型学习与输出情绪向量具体为:利用个性化情绪参数库,设计神经网络模型,输入层接收冰壶运动员在进行喊话、命令以及其他交流时的音频;在隐藏层,采用卷积神经网络提取深层特征,并引入注意力机制聚焦关键区域;加入情绪向量学习模块,从特征中学习并输出情绪向量,代表此时冰壶比赛音频中蕴含的情绪在愉快、悲伤、害怕、恐惧、惊喜、生气和嫌恶上的权重,得到1*7的向量;通过训练模型最小化预测与真实情绪向量间的误差,实时从冰壶运动员喊话和表情中提取个性化情绪特征; 在步骤3中,使用神经网络模型提取冰壶比赛音频片段中的音频特征并进行特征表示;使用表达网络分析表达特征;全连接层将表情参数向量扩展为BlendShape参数权重; 在步骤3中,将步骤2得到的情绪向量与个性化情绪参数库保存的BlendShape参数相乘,得到情绪基底;将情绪基底与神经网络从冰壶比赛音频中解析的表情参数加权相加,得到带有情绪的个性化表情参数;设计整体的损失函数值Loss为: 其中,表示预测的BlendShape参数与真值的均方误差最小值,表示前后帧之间的连贯性稳定值;n是BlendShape参数的通道数,是网络输出,是期望输出,是对应帧的网络输出的差,是对应帧的期望输出的差。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学;哈工大郑州研究院,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。