Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学;中国移动通信有限公司研究院;中国移动通信集团有限公司;中国移动通信集团江苏有限公司王利民获国家专利权

南京大学;中国移动通信有限公司研究院;中国移动通信集团有限公司;中国移动通信集团江苏有限公司王利民获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学;中国移动通信有限公司研究院;中国移动通信集团有限公司;中国移动通信集团江苏有限公司申请的专利一种基于弱监督多模态大模型的视频高光检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785257B

龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411749286.3,技术领域涉及:G06V20/40;该发明授权一种基于弱监督多模态大模型的视频高光检测方法是由王利民;张拯明;黄振鹏;陈茜;李嘉骐;吴涛设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。

一种基于弱监督多模态大模型的视频高光检测方法在说明书摘要公布了:一种基于弱监督多模态大模型的视频高光检测方法,基于视频语言大模型,构建视频片段与文字描述的配对数据,并配置高光检测模块用于根据高光检测指令对视频帧进行显著性得分计算,通过多阶段的渐进式训练方式训练得到高光检测模型,用于对视频的高光检测。本发明通过生成高质量的伪标签、设计时序敏感的高光检测模块以及渐进式多阶段训练策略,显著提升了高光检测的精度和效率,在内容优化与个性化推荐、视频剪辑与制作、社交媒体、教育与培训等场景中具有广泛的实际应用价值。

本发明授权一种基于弱监督多模态大模型的视频高光检测方法在权利要求书中公布了:1.一种基于弱监督多模态大模型的视频高光检测方法,其特征是基于视频语言大模型,构建视频片段与文字描述的配对数据,并配置高光检测模块用于根据高光检测指令对视频帧进行显著性得分计算,通过多阶段的渐进式训练方式训练得到高光检测模型,用于对视频的高光检测,包括以下步骤: S1、以视频帧、视频描述指令以及对应字幕为输入,通过视觉语言大模型生成视频片段与描述字幕构成的高光检测伪标签数据:计算视频中的视觉token与对应字幕的文本token之间的注意力得分,并利用注意力得分量化视觉token对核心要素的贡献,通过对每个视觉token的贡献进行累加,得到其总贡献得分;在帧级别上,计算所有视觉token总贡献得分的平均值,得出该帧的伪显著性得分,再对帧级别的伪显著性得分进行归一化处理,得到高光伪标签; S2、构建时序数值敏感的高光检测模块,以视频帧和高光检测指令为视觉语言大模型的输入,高光检测模块对输出预测显著性分数,引入可学习的条件嵌入,所述可学习的条件嵌入与高光检测指令和视频帧一并输入视觉语言大模型,高光检测模块基于Transformer解码器架构,将视觉语言大模型对应条件嵌入部分的输出作为高光检测模块的交叉注意力的输入部分,即作为交叉注意的键和值,通过自回归方式,高光检测模块自适应地处理变长序列的视频帧,输出每一帧的显著性得分; S3、多阶段的渐进式训练阶段一,基于伪标签的弱监督学习:由视频语言大模型和高光检测模块构成高光检测模型,利用步骤S1中生成的高光伪标签数据进行弱监督训练,在训练过程中,使用hingeloss作为损失函数,优化高光检测模块的显著性得分与高光伪标签之间的差距; S4、多阶段的渐进式训练阶段二,基于人工标注数据的监督学习:引入高光检测人工标注,对步骤S3训练所得高光检测模型中的高光检测模块进行监督学习,提升高光检测模块对显著性得分的预测精度; 经过多阶段的渐进式训练后的高光检测模型,用于对输入的视频及高光检测指令进行高光检测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学;中国移动通信有限公司研究院;中国移动通信集团有限公司;中国移动通信集团江苏有限公司,其通讯地址为:210093 江苏省南京市鼓楼区汉口路22号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。