阿里巴巴达摩院(杭州)科技有限公司王家喻获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利基于语音的图像驱动方法和图像驱动的数据处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116363269B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310252857.1,技术领域涉及:G06F16/70;该发明授权基于语音的图像驱动方法和图像驱动的数据处理方法是由王家喻;赵康;张士伟;张迎亚;沈宇军设计研发完成,并于2023-03-08向国家知识产权局提交的专利申请。
本基于语音的图像驱动方法和图像驱动的数据处理方法在说明书摘要公布了:本说明书实施例提供基于语音的图像驱动方法和图像驱动的数据处理方法,其中基于语音的图像驱动方法包括:获取参考语音和虚拟对象的参考面部图像,对参考语音进行语音编码,得到目标语音特征,并对参考面部图像进行图像编码,得到第一区域的第一图像特征和第二区域的第二图像特征,基于面部先验特征和目标语音特征,对第一图像特征进行特征变换,确定第一目标图像特征,其中,面部先验特征包括面部纹理特征,根据第一目标图像特征和第二图像特征,生成驱动后的目标图像。基于目标语音特征和面部先验特征,对第一图像特征进行特征变换,解码得到了高保真度和高清晰度的目标图像,提升了用户体验。
本发明授权基于语音的图像驱动方法和图像驱动的数据处理方法在权利要求书中公布了:1.一种基于语音的图像驱动方法,包括: 获取参考语音和虚拟对象的参考面部图像; 对所述参考语音进行语音编码,得到目标语音特征,并对所述参考面部图像进行图像编码,得到第一区域的第一图像特征和第二区域的第二图像特征,其中,所述第一区域为所述参考面部图像跟随语音变化的区域,所述第二区域为所述参考面部图像除所述第一区域以外的区域; 基于面部先验特征和所述目标语音特征,对所述第一图像特征进行特征变换,确定第一目标图像特征,其中,所述面部先验特征包括样本图像中虚拟对象面部的多对第一区域和第二区域的面部纹理特征,所述基于面部先验特征和所述目标语音特征,对所述第一图像特征进行特征变换,确定第一目标图像特征,包括:利用所述面部先验特征,对所述第一图像特征进行注意力计算,得到注意力图像特征,根据所述目标语音特征,对所述注意力图像特征进行特征优化,得到所述第一区域的第一目标图像特征; 根据所述第一目标图像特征和所述第二图像特征,生成驱动后的目标图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励