北京潞晨科技有限公司刘澳阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京潞晨科技有限公司申请的专利一种特定人物的视频生成方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119815147B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411974178.6,技术领域涉及:H04N21/854;该发明授权一种特定人物的视频生成方法、装置、设备及介质是由刘澳阳;郑奘巍;彭翔宇;柳泓鑫;卞正达;李永彬;麦思琪;崔子源;李彤;赵元亨设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种特定人物的视频生成方法、装置、设备及介质在说明书摘要公布了:本发明公开了一种特定人物的视频生成方法、装置、设备及介质。该方法包括:根据用户输入的待生成视频的视频提示词以及目标人物的人脸图像,分别获取提示词文本生成特征以及抽象人脸面部特征;通过多模态变压器扩散生成模型,对提示词文本生成特征以及抽象人脸面部特征进行多轮处理,获取目标人物相关图像;其中,多模态变压器扩散生成模型中通过跨注意力机制实现特征融合;根据目标人物相关图像,生成特定人物视频。采用上述技术方案,能够实现仅需单张人物图像,即可生成特定人物视频,算力消耗低,耗时较短,能够高效、便捷的获取特定人物的视频,提高用户的使用体验。
本发明授权一种特定人物的视频生成方法、装置、设备及介质在权利要求书中公布了:1.一种特定人物的视频生成方法,其特征在于,包括: 根据用户输入的待生成视频的视频提示词以及目标人物的单张人脸图像,分别获取提示词文本生成特征以及抽象人脸面部特征; 通过多模态变压器扩散生成模型,对所述提示词文本生成特征以及抽象人脸面部特征进行多轮处理,获取目标人物相关图像;其中,所述多模态变压器扩散生成模型中通过跨注意力机制实现特征融合; 根据所述目标人物相关图像,生成特定人物视频; 其中,获取抽象人脸面部特征,包括: 将所述单张人脸图像分别输入至文本-图像预训练模型以及人脸图像识别模型中,并获取文本-图像预训练模型以及人脸图像识别模型分别输出的第一人脸特征以及第二人脸特征; 将所述第一人脸特征以及第二人脸特征分别通过多层感知机进行处理,获取多层感知机输出的抽象人脸面部特征; 其中,所述多层感知机使用GELU激活函数; 其中,所述第一人脸特征包括人脸本身的视觉特征,以及与文本相关的语义关联信息;所述第二人脸特征包含个人身份的特有信息,用于区分不同的人; 对所述提示词文本生成特征以及抽象人脸面部特征进行多轮处理,获取目标人物相关图像,包括: 根据所述提示词文本生成特征,获取图像文本生成特征; 对所述图像文本生成特征以及所述抽象人脸面部特征进行多轮次的融合以及拆分,并根据最后一次拆分结果,获取目标人物相关图像; 对所述图像文本生成特征以及所述抽象人脸面部特征进行多轮次的融合以及拆分,包括: 通过跨注意力机制,融合所述图像文本生成特征以及抽象人脸面部特征,获取图像文本联合特征; 对所述图像文本联合特征进行拆分,根据拆分结果更新图像生成特征以及提示词文本生成特征; 根据更新后的图像生成特征以及提示词文本生成特征,重复执行多轮次的特征融合以及特征拆分操作,直至满足结束条件。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京潞晨科技有限公司,其通讯地址为:100080 北京市海淀区北四环西路66号17层2018室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励