上海人工智能创新中心庄少彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海人工智能创新中心申请的专利长视频的生成方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117768746B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311863627.5,技术领域涉及:H04N21/81;该发明授权长视频的生成方法、装置、设备及存储介质是由庄少彬;黎昆昌;陈昕苑;王耀晖;乔宇;王亚立设计研发完成,并于2023-12-29向国家知识产权局提交的专利申请。
本长视频的生成方法、装置、设备及存储介质在说明书摘要公布了:本发明实施例提供了一种长视频的生成方法、装置、设备及存储介质。包括:基于原始文本与大语言模型进行多轮交互,获得目标文本;其中,所述目标文本包括多个场景的子文本以及各场景的持续时长;基于所述目标文本生成至少一个主体对象的图像,并确定各场景对应的主体对象;对于每个场景,根据所述主体对象的图像和或所述子文本生成所述场景对应的音视频;将各场景的音视频进行拼接,获得目标长视频。本发明实施例提供的长视频的生成方法,基于各场景的主体对象、主体对象的图像及子文本生成目标长视频,可以提高生成的长视频的质量,以及降低生成长视频的成本。
本发明授权长视频的生成方法、装置、设备及存储介质在权利要求书中公布了:1.一种长视频的生成方法,其特征在于,包括: 基于原始文本与大语言模型进行多轮交互,获得目标文本;其中,所述目标文本包括多个场景的子文本以及各场景的持续时长; 基于所述目标文本生成至少一个主体对象的图像,并确定各场景对应的主体对象; 对于每个场景,根据所述主体对象的图像和或所述子文本生成所述场景对应的音视频; 将各场景的音视频进行拼接,获得目标长视频; 基于原始文本与大语言模型进行多轮交互,获得目标文本,包括: 对于与大语言模型的首轮交互,将所述原始文本及首轮交互对应的提示文本输入所述大语言模型,输出中间文本; 对于与大语言模型的非首轮交互,将上一轮交互输出的中间文本与该轮交互对应的提示文本输入所述大语言模型,输出该轮交互对应的中间文本或目标文本;其中,所述非首轮交互包括:中间轮交互或者末轮交互,所述非首轮交互对应的提示文本是用于提示大语言模型对中间文本进行调整或完善的语句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海人工智能创新中心,其通讯地址为:200232 上海市徐汇区云锦路701号37、38层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励