乐山师范学院门涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉乐山师范学院申请的专利一种微课视频自动生成方法、装置、设备、介质及产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118870112B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410888405.7,技术领域涉及:H04N21/44;该发明授权一种微课视频自动生成方法、装置、设备、介质及产品是由门涛;王建军;张贵红;廖夏妍;樊丁;曹鹏;李彬;孙燕;陈雨苹;蒋蕊设计研发完成,并于2024-07-04向国家知识产权局提交的专利申请。
本一种微课视频自动生成方法、装置、设备、介质及产品在说明书摘要公布了:本申请公开了一种微课视频自动生成方法、装置、设备、介质及产品,涉及微课视频制作领域,该方法包括基于教师的教学视频,克隆教师声音;提取所述教学视频中教师的面部关键点,构建所述教师的虚拟数字人;提取教师讲稿,生成教学文案;从所述教学视频中提取PPT内容,重构PPT页面;合成克隆后的教师声音、所述虚拟数字人、所述教学文案以及所述PPT页面,创建微课教学视频。本申请能够降低技术难度,提高微课视频的生成效率。
本发明授权一种微课视频自动生成方法、装置、设备、介质及产品在权利要求书中公布了:1.一种微课视频自动生成方法,其特征在于,所述微课视频自动生成方法基于人工智能技术实现,包括: 基于教师的教学视频,克隆教师声音; 提取所述教学视频中教师的面部关键点,构建所述教师的虚拟数字人; 构建虚拟数字人包括以下步骤: 1)面部关键点检测:使用深度学习模型输出关键点向量KP=[x1,y1,x2,y2,...,xN,yN],其中,xN,yN为面部关键点坐标,N为面部关键点数量; 2)3D面部模型重建:3D面部模型M由关键点向量KP通过形变模型M=f(KP)获得; 3)面部纹理映射:纹理T通过T=gM,I映射到3D面部模型M上,I是输入的2D面部图像; 4)生成对抗网络训练:生成器G:DI=Gz,c,其中,z是随机噪声,c是条件编码;判别器D:DI被分类为真实或生成; 5)数字人形象生成:Dt=GANFt其中,Dt是数字教师形象,Ft是教师的形态特征; 6)动画与驱动; 7)渲染与输出; 8)后处理与优化; 提取教师讲稿,生成教学文案; 从所述教学视频中提取PPT内容,重构PPT页面,具体包括: 根据所述教学视频中各个视频帧的时间戳和内容变化,从所述教学视频中提取关键帧;所述关键帧包含PPT内容; 采用目标检测算法,定位所述关键帧中PPT内容的显示区域; 基于所述显示区域,采用图像分割技术,分离所述PPT内容以及背景; 采用光学字符识别技术识别分离出PPT内容中的文字; 采用图像修复技术,修复被遮挡的PPT内容,生成修复后的PPT内容; 将分离出的PPT内容中的文字以及修复后的PPT内容重新组合,调整PPT布局和样式,重构PPT页面; 合成克隆后的教师声音、所述虚拟数字人、所述教学文案以及所述PPT页面,创建微课教学视频,具体包括: 利用语音分析技术,提取所述克隆后的教师声音的音频特征;所述音频特征包括音素、音量以及音高; 将所述音频特征输入至卷积神经网络和循环神经网络的组合模型,输出嘴唇动作序列;所述组合模型为唇形同步模型; 利用Blendshape技术在3D面部模型的顶点进行形变,生成形变后的3D面部模型; 将所述嘴唇动作序列应用至所述形变后的3D面部模型,生成带有动态嘴唇动作的虚拟数字人; 采用3D渲染引擎渲染所述带有动态嘴唇动作的虚拟数字人,生成渲染后的虚拟数字人; 同步合成所述渲染后的虚拟数字人、所述克隆后的教师声音、所述教学文案以及所述PPT页面,创建微课教学视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人乐山师范学院,其通讯地址为:614000 四川省乐山市滨河路778号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。