西安工业大学胡秀华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安工业大学申请的专利一种基于Transformer特征集成网络的跟踪方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116704294B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310830020.0,技术领域涉及:G06V10/774;该发明授权一种基于Transformer特征集成网络的跟踪方法是由胡秀华;刘焕;惠燕;赵婧;尤世界;胡旭洋;吴玺设计研发完成,并于2023-07-07向国家知识产权局提交的专利申请。
本一种基于Transformer特征集成网络的跟踪方法在说明书摘要公布了:本发明属于计算机视觉领域,具体涉及一种基于Transformer特征集成网络的跟踪方法。所提供的技术方案包括以下步骤:步骤一、使用AlexNet作为特征提取网络,将后三层的特征分别通过卷积Conv进行融合得到新的三个特征向量F3、F4、F5;步骤二、将F3与F4通过维度重塑后,作为Transformer编码器的输入,进行特征层之间全局依赖构建;步骤三、将编码器的输出与维度重塑后的F5特征在Transformer解码器中进行信息交互,得到最终用于分类和回归网络的特征向量。本发明提出的跟踪方法,减少了参数计算量,有效提高了跟踪器的效率,可获得表征能力更强的特征向量,在跟踪精确度、成功率上都有大幅提高。
本发明授权一种基于Transformer特征集成网络的跟踪方法在权利要求书中公布了:1.一种基于Transformer特征集成网络的跟踪方法,其特征在于:包括以下步骤: 步骤一、使用AlexNet作为特征提取网络,将后三层的特征分别通过卷积进行融合得到新的三个特征向量F3、F4、F5: 从视频中选取模板图像z和搜索图像x两帧作为AlexNet网络的输入,将其送入到孪生网络架构中,获取Layer3、Layer4和Layer5层的特征向量,将该三层的模板特征和搜索特征分别通过一层卷积将其进行特征信息的补充融合,最后得到融合后的三个特征向量F3、F4、F5; 步骤二、将F3与F4通过维度重塑后,作为Transformer编码器的输入,进行特征层之间全局依赖构建,所述Transformer特征集成网络包含编码器和解码器,所述编码器由两个多头注意力层、相似性计算层、时间上下文过滤层、FFN组成,相关性计算层包括一个全局平局池化和前向传播层;同时在编码器和解码器中的FFN中,均引入双重注意力机制,包含通道和空间注意力两个分支; 步骤三、输入经过维度重塑处理得到的AlexNet网络的深层特征F5,将F'5经过一个多头注意力层后与编码器的输出FE进行信息交互,得到最终用于分类和回归网络的特征向量; 所述步骤二中,将F3与F4通过维度重塑,即将F3和F4从CⅹWxH转变成Cx1x1,然后得到F'3和F'4之后再进行归一化,如公式6 其中,为特征向量F'3和F'4经过相加归一化的输出,Norm为归一化操作,通过第一个自注意力机制层的输入输出如公式7 其中,为第一个编码器中第一个自注意力机制的输出,通过第二自注意力机制层的输入输出如公式8; 其中,为第二个自注意力机制的输出; 所述步骤二中,上述相关性计算层的计算过程如公式9-11, SignF'4=FFNCAPF'49 其中,SignF'4为特征向量F'4经过全局平均池化和前馈网络得到的F'4中显著性特征,为经过两层自注意力机制的输出和特征向量F'4进行信息结合的输出,为和SignF'4之间进行相关性突出的具有显著性特征的输出; 所述步骤二中,时间上下文过滤层的计算过程如公式12-14, 其中,为特征经过卷积、全局平局池化、前馈网络的输出,为特征之间特征信息交互得到的输出,为时间上下文过滤层的输出; 将特征和与进行特征融合,得到最终的增强特征
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安工业大学,其通讯地址为:710032 陕西省西安市未央区学府中路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励