百度在线网络技术(北京)有限公司郝鑫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉百度在线网络技术(北京)有限公司申请的专利生成视频的方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119031211B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411170414.9,技术领域涉及:H04N21/854;该发明授权生成视频的方法、装置、电子设备及存储介质是由郝鑫;徐飞;王凯;谢校康设计研发完成,并于2024-08-23向国家知识产权局提交的专利申请。
本生成视频的方法、装置、电子设备及存储介质在说明书摘要公布了:本公开提供了一种生成视频的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大语言模型、生成模型、图像处理等领域。具体实现方案为:响应于接收到输入信息,将输入信息中的N个输入图像转换为符合输入信息中的目标风格的N个图像;N是大于等于1的整数;根据N个输入图像,确定故事文本;其中,故事文本包括与N个图像相对应N个子文本;根据N个图像和N个子文本,确定初始视频;其中,初始视频包括多个页面,每个页面包括图像和子文本;以及响应于确定针对多个页面中目标页面中的字符的修改操作,根据修改后的字符的字符属性或修改后的目标页面的页面图像更新初始视频,得到目标视频;其中,字符包括目标页面中的子文本。
本发明授权生成视频的方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种生成视频的方法,包括: 响应于接收到输入信息,将所述输入信息中的N个输入图像转换为符合所述输入信息中的目标风格的N个图像;其中,N是大于等于1的整数,所述输入图像包括至少一个对象,所述至少一个对象中的每个对象对应至少一个标签,所述标签包括用于描述对象所具有特征的文本;所述将所述输入信息中的N个输入图像转换为符合所述输入信息中的目标风格的N个图像包括:针对所述N个输入图像中的每个输入图像,确定所述输入图像中的对象数量,基于所述对象数量确定场景,在所述场景为多对象场景的情况下,建立所述标签与对象位置之间的对应关系,并基于所述标签生成针对所述对象位置的图像区域; 根据所述N个输入图像,确定故事文本;其中,所述故事文本包括与所述N个图像相对应N个子文本; 根据所述N个图像和所述N个子文本,确定初始视频;其中,所述初始视频包括多个页面,每个页面包括图像和子文本;以及 响应于确定针对所述多个页面中目标页面中的字符的修改操作,根据修改后的字符的字符属性或修改后的目标页面的页面图像更新所述初始视频,得到目标视频;其中,所述字符包括所述目标页面中的子文本;所述修改后的目标页面包括:所述图像、所述字符和用于指示所述字符所处区域的标记符号; 其中,所述字符属性是通过以下方式确定的:根据所述目标页面在前端的尺寸和至少一行字符在所述目标页面中的坐标,确定前端展示过程中所述至少一行字符在所述目标页面的相对坐标;基于目标调整比例将所述目标页面的尺寸进行扩大或缩小;基于所述相对坐标确定所述至少一行字符在后端的坐标;所述字符属性包括所述至少一行字符在后端的坐标; 其中,所述修改后的目标页面的页面图像是通过以下方式得到的:从所述目标页面中删除所述标记符号,得到处理后页面;对所述处理后页面进行截图操作;以及根据截图操作得到的图像,确定所述修改后的目标页面的页面图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人百度在线网络技术(北京)有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励