湘江实验室张峰祎获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湘江实验室申请的专利融合分镜层级信息的SSML文本自动生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121072489B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511616299.8,技术领域涉及:G06F40/166;该发明授权融合分镜层级信息的SSML文本自动生成方法及装置是由张峰祎;詹敏;周思怡;曾子贤;肖美琪设计研发完成,并于2025-11-06向国家知识产权局提交的专利申请。
本融合分镜层级信息的SSML文本自动生成方法及装置在说明书摘要公布了:本申请一种融合分镜层级信息的SSML文本自动生成方法及装置,该方法步骤包括:步骤S01.获取目标短视频原始信息进行解析,并依次按照剧本、分幕、分镜三个层级进行信息结构化;步骤S02.获取多源输入特征,包括画外音文本、关联角色特征、关联分幕特征以及关联分镜特征;步骤S03.将多源输入特征输入至预先训练好的SSML生成模型中,将多源输入特征编码后进行融合得到融合特征,经Transformer解码器得到SSML标签序列,序列中每个元素包括SSML标签类型及对应参数,按层级关系依次拼接后形成完整SSML文本输出。本申请能够提高SSML参数与分镜、角色之间的匹配度,提升SSML文本生成质量。
本发明授权融合分镜层级信息的SSML文本自动生成方法及装置在权利要求书中公布了:1.一种融合分镜层级信息的SSML文本自动生成方法,其特征在于,步骤包括: 步骤S01.信息结构化:获取目标短视频原始信息进行解析,并依次按照剧本层级、分幕层级以及分镜层级进行信息结构化,其中所述剧本层级用于存储全剧本共享信息,在所述剧本层级的基础上构建形成分幕层级,所述分幕层级用于记录分幕间叙事节奏、叙事节点信息,在所述分幕层级的基础上构建形成分镜层级,所述分镜层级用于关联单个分镜画面元素、画外音文本; 步骤S02.多源输入特征获取:根据步骤S01的信息结构化结果获取多源输入特征,所述多源输入特征包括画外音文本、关联的角色特征、关联的分幕特征以及关联的分镜特征; 步骤S03.SSML生成:将所述多源输入特征输入至预先训练好的SSML生成模型中,由所述SSML生成模型将所述多源输入特征编码后进行融合得到融合特征,经 Transformer 解码器得到SSML标签序列,所述SSML标签序列中每个元素包括SSML标签类型及对应参数,将所述SSML标签序列按层级关系依次拼接后形成完整SSML文本输出; 步骤S03中,SSML生成模型包括依次连接的输入层、子编码器层、融合层以及解码器层,输入层用于接收多源输入特征 ,子编码器层用于对多源输入特征分别进行编码,融合层用于对子编码器层中各编码器输出的编码结果进行融合得到融合特征,解码器层用于对融合层输出的融合特征进行解码,输出 SSML 文本,其中,子编码器层包括文本子编码器、角色子编码器、叙事节点子编码器以及分镜语义子编码器,通过将画外音文本经过文本子编码器编码为文本向量,将角色语音演化特征经角色子编码器编码为语音参数向量,将分幕叙事特征经叙事节点编码器将分幕节奏与节点调整规则编码为向量得到叙事向量,以及将分镜特征经分镜语义编码器编码时长、语义权重及画面元素得到分镜语义向量,融合层将文本向量、语音参数向量、叙事向量以及分镜语义向量进行加权融合得到融合向量;将所述文本向量、语音参数向量、叙事向量以及分镜语义向量进行加权融合得到融合向量的过程中,当分幕叙事节奏的推进速度超过预设阈值时,提升所述叙事向量的权重、降低所述文本向量的权重,当节点类型为冲突点时,提升所述叙事向量的权重、降低所述分镜语义向量的权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘江实验室,其通讯地址为:410221 湖南省长沙市长沙高新区尖山路217号北斗产业园1栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励