电子科技大学长三角研究院(衢州)王卓然获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学长三角研究院(衢州)申请的专利基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120013992B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510082300.7,技术领域涉及:G06T7/246;该发明授权基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统是由王卓然;朱滨阳;袁国慧设计研发完成,并于2025-01-20向国家知识产权局提交的专利申请。
本基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统在说明书摘要公布了:本发明公开了一种基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统,属于计算机视觉与图像处理技术领域,解决现有技术在无人机采集的图像质量差或图像特征不明显时,易造成目标跟踪能力及长时跟踪能力差的问题。本发明无人机视角的图像中的交通事故场景进行自然语言描述,获取语言提示;构建场景‑上下文特征金字塔网络对无人机视角的图像进行上下文信息增强处理获得特征增强后的图像;对增强后的图像和语言提示分别进行视觉编码和语言编码,获得视觉特征以及语言特征向量进行视觉‑语言双模态特征局部对齐;将得到的对齐之后的新语言特征与视觉特征进行充分融合,获得多模态特征进行目标跟踪。本发明用于无人机多模态特征融合目标跟踪。
本发明授权基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统在权利要求书中公布了:1.一种基于自然语言描述的无人机多模态特征融合目标跟踪方法,其特征在于,包括如下步骤: 步骤1、获取无人机视角的交通事故场景视频,将视频转换为无人机视角的图像,对图像进行标注,并对图像中的交通事故场景进行自然语言描述,获取语言提示; 步骤2、构建场景-上下文特征金字塔网络对步骤1中无人机视角的图像进行上下文信息增强处理获得特征增强后的图像; 步骤3、对步骤2增强后的图像和步骤1得到的语言提示分别进行视觉编码和语言编码,获得视觉特征以及语言特征向量; 步骤4、将视觉特征处理为视觉特征向量并与对应的语言特征向量进行视觉-语言双模态特征局部对齐; 步骤5、将步骤4得到的对齐之后的新语言特征与步骤3中得到的视觉特征进行充分融合,获得多模态特征; 步骤6、若当前无人机视角的图像为第一帧,预先训练的具有交通事故的历史特征输入解码器解码,再对解码后的结果经过定位头获得最终跟踪结果,同时转到步骤7,否则,将上一帧获得的跟踪结果作为历史特征并与上一帧的多模态特征输入解码器解码,再对解码后的结果经过定位头获得最终跟踪结果,同时转到步骤7,其中,最终跟踪结果包括目标框; 步骤7、当前无人机视角的图像非最后一帧时,基于跟踪结果对每一帧进行跟踪处理后,根据目标框对多模态特征的目标区域进行感兴趣区域池化,得到目标区域特征,再对目标区域特征进行平面化处理,得到历史特征,再转到步骤1进行下一帧跟踪处理,否则,结束跟踪。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学长三角研究院(衢州),其通讯地址为:324003 浙江省衢州市柯城区成电路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励