快上云(上海)网络科技有限公司张诏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉快上云(上海)网络科技有限公司申请的专利一种基于AI的儿童故事视频生成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120812370B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511289500.6,技术领域涉及:H04N21/854;该发明授权一种基于AI的儿童故事视频生成方法及系统是由张诏;王雪妍;周梦辛悦;苏东旭;郑长水设计研发完成,并于2025-09-10向国家知识产权局提交的专利申请。
本一种基于AI的儿童故事视频生成方法及系统在说明书摘要公布了:本发明公开了一种基于AI的儿童故事视频生成方法及系统,涉及人工智能与多媒体交叉技术领域,包括,本发明通过构建融合情感建模能力的AI模型,将用户输入的原始文本生成脚本;构建图像生成组合模型,定义联合损失函数,使用Sobel边缘检测算法计算轮廓图像的边缘强度图,使用块匹配算法计算帧变化的光流场,进行彩色图像动态帧对齐;使用微调WaveNet模型生成音频;通过构建图像生成组合模型,结合StyleGAN3‑T模型、LDM模型,定义联合损失函数,使用Sobel边缘检测算法和块匹配算法计算边缘强度图和光流场,实现彩色图像的动态帧对齐,提升生成视频的帧间连续性。
本发明授权一种基于AI的儿童故事视频生成方法及系统在权利要求书中公布了:1.一种基于AI的儿童故事视频生成方法,包括,其特征在于:包括, 构建融合情感建模能力的AI模型,将用户输入的原始文本生成脚本; 构建图像生成组合模型,包括StyleGAN3-T模型生成轮廓图像,LDM模型生成彩色图像,定义联合损失函数,使用Lookahead优化器进行迭代求解,使用Sobel边缘检测算法计算轮廓图像的边缘强度图,使用块匹配算法计算帧变化的光流场,进行彩色图像动态帧对齐; 定义情感调制函数作为微调WaveNet模型的条件,使用微调WaveNet模型生成音频; 使用FFmpeg工具将视频和音频生成儿童故事视频,构建可视化界面供用户调整和修改; 所述构建融合情感建模能力的AI模型,将用户输入的原始文本生成脚本,包括: 所述AI模型,包括语义编码器、情感语义嵌入单元、提示工程单元、逻辑一致性检查单元和内容-情感解纠缠单元; 使用语义编码器将用户输入的原始文本编码为语义向量,使用情感语义嵌入单元将用户输入的原始文本映射到情感空间,生成情感向量,使用BERT微调的适龄性分类模型,将语义向量和情感向量进行分类,将不适合儿童的内容进行过滤,得到适龄语义向量和情感向量; 将适龄语义向量和情感向量,使用Faiss索引在儿童故事模板库中分别检索相似模板,使用提示工程单元,将适龄语义向量、适龄情感向量和相似模板进行整合为结构化的提示文本,并使用解码器解码为文本结构; 将文本结构映射为图结构,构建图神经网络GNN模型,使用儿童故事模板的图结构进行训练,学习节点嵌入以捕捉全局叙事结构,输入图结构,输出叙事图,提取叙事图的子图,使用ChatGLM模型生成子图对应的文本提示; 基于输入的原始文本,使用ChatGLM模型将文本提示生成子脚本,将子脚本和文本提示使用双向注意力机制,提取上下文信息,生成情感标签; 所述内容-情感解纠缠单元和逻辑一致性检查单元,包括: 所述内容-情感解纠缠单元,用于使用预训练的Transformer模型将子脚本和情感标签映射到统一语义空间,输出联合嵌入向量,并通过变分自编码器分离联合嵌入向量中的内容特征向量和情感特征向量; 所述逻辑一致性检查单元,用于使用余弦相似性验证子脚本的逻辑连贯性,通过BERT微调的适龄性分类模型验证适龄性,若有一项不满足验证条件,重新生成子脚本,将每个子脚本的内容特征向量和情感特征向量进行关联整合,生成完整脚本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人快上云(上海)网络科技有限公司,其通讯地址为:201207 上海市浦东新区中国(上海)自由贸易试验区芳春路400号1幢3层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励