中电信无人科技(江苏)有限公司罗前春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电信无人科技(江苏)有限公司申请的专利一种基于深度学习跨模态技术的无人机视频检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120316305B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510774162.9,技术领域涉及:G06F16/78;该发明授权一种基于深度学习跨模态技术的无人机视频检索方法是由罗前春;杨垠彬;单海峰;余晓龙;孙井花;李响;范沐阳;陈美设计研发完成,并于2025-06-11向国家知识产权局提交的专利申请。
本一种基于深度学习跨模态技术的无人机视频检索方法在说明书摘要公布了:本发明公开了一种基于深度学习跨模态技术的无人机视频检索方法,包括:根据用户输入的文本,进行初步分类,获取待检测的时间、地点、对象和目的;从时间、地点、对象三个维度对原始视频进行预筛选,得到可能的关键帧和包含检测对象的目标框;根据改进后的VIT模型对文本和预筛选的关键帧进行精准匹配,得到准确图片帧;搭建基于GRU‑CRF的神经网络,根据待检测的目的调整GRU网络的步长,对准确图片帧进行处理,将属于同一个视频片段的图片帧归类,得到符合用户要求的视频片段。本发明从四个维度的信息抽取关键帧和对图片帧进行分类,极大地缩短了视频检索时长,提高了视频检索效率和准确性。
本发明授权一种基于深度学习跨模态技术的无人机视频检索方法在权利要求书中公布了:1.一种基于深度学习跨模态技术的无人机视频检索方法,其特征在于,所述方法包括以下步骤: S1,对检索文本进行特征向量化处理,将检索文本转换为高维向量;根据用户输入的文本,进行初步分类,获取待检测的时间、地点、对象和目的; S2,根据视频连续帧变换、无人机飞行参数和用户输入的检索文本中提炼出的检测对象信息,从时间、地点、对象三个维度对原始视频进行预筛选,得到可能的关键帧和包含检测对象的目标框; S3,通过步骤S2得到的目标框对VIT模型进行改进,并根据改进后的VIT模型对文本和预筛选的关键帧进行精准匹配,得到准确图片帧; S4,搭建基于GRU-CRF的神经网络,根据步骤S1获取的待检测的目的调整GRU网络的步长,采用基于GRU-CRF的神经网络对步骤S3得到的准确图片帧进行处理,将属于同一个视频片段的图片帧归类,得到符合用户要求的视频片段;步骤S4进一步包括: 分析检测目标,明确其对应的时间需求细粒度及事件特征;依据时间需求细粒度,设定GRU网络的步长,将准确图片帧输入GRU网络,通过GRU网络的时序建模能力,输出不同时段且带有相应事件特征标签的图片帧序列,完成初步的时序特征提取与事件标签标注; 将带有相应事件特征标签的图片帧序列导入CRF模型,由CRF模型基于图片帧间的上下文关联以及标签间的依赖关系,结合不同时间点的场景变化、动作延续性因素,计算事件开始、事件进行中、事件结束这三个不同时间标签在整个图片帧序列上的联合概率; 基于联合概率判断事件持续时间是否符合预设的时间需求,并输出每个图片帧对应的特征表示与标签信息,优化事件时序分析结果; 按照视频原始时序,将属于同一视频片段的图片帧进行归类整合,得到包含检测目的对应事件、主题或属性的视频片段,对视频内容进行结构化提取与划分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电信无人科技(江苏)有限公司,其通讯地址为:211000 江苏省南京市建邺区江心洲贤坤路5号5栋智立方G座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。