安徽大学李成龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利一种基于多尺度和多视角特征对齐的文本车辆重识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116704452B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310699095.X,技术领域涉及:G06V20/54;该发明授权一种基于多尺度和多视角特征对齐的文本车辆重识别方法是由李成龙;丁乐奇设计研发完成,并于2023-06-12向国家知识产权局提交的专利申请。
本一种基于多尺度和多视角特征对齐的文本车辆重识别方法在说明书摘要公布了:一种基于多尺度和多视角特征对齐的文本车辆重识别方法,属于深度学习技术领域,解决现有车辆重识别视角挑战问题;构建基于残差网络ResNet‑50和卷积神经网络的双流特征学习网络;在视觉编码器引入车辆视角掩码提取对应视角特征,并从编码器的不同层提取多尺度特征;在文本编码器使用文本卷积网络构建多视角和多尺度分支,使用对齐的视觉特征监督相应分支的学习;为了有效的进行各个分支的对齐,提出了掩码双向匹配损失,掩盖同一车辆下不成对的样本并考虑文本到图像和图像到文本双向的检索;通过引入视角掩码有效的解耦了车辆不同视角的特征,并挖掘图像文本之间多尺度的匹配线索;掩码双向匹配损失保证训练稳定性的同时加速模型收敛。
本发明授权一种基于多尺度和多视角特征对齐的文本车辆重识别方法在权利要求书中公布了:1.一种基于多尺度和多视角特征对齐的文本车辆重识别方法,其特征在于,包括以下步骤: 步骤1、采用ResNet-50残差网络提取图像特征图,提取输入车辆图像的视觉多尺度特征; 步骤2、通过在ResNet-50残差网络中间层引入车辆视角掩码,获得车辆图像的视角特征,方法具体为:ResNet-50残差网络包含五个层,每个层由残差块和池化层组成;将ResNet-50残差网络不同层的输出当做视觉低层特征和视觉高层特征;在训练阶段,训练数据为,其中N代表相互匹配并属于同一身份的图像-文本对的数量;给定一张车辆图像,则残差网络ResNet第五阶段获得的高层图像特征为,第四阶段获得的低层特征为,其中; 步骤3、使用车辆视角掩码生成视角分支的相似度权重,方法具体为:将ResNet-50残差网络第四层输出的特征图定义为中间层特征,并引入训练好的车辆视角掩码,从而获得对应的视角特征;再使用视角特征聚合获得复合视角特征,其中; 步骤4、使用BERT和文本卷积网络提取多尺度、多视角的车辆文本特征,方法具体为:在文本分支中,利用自然语言处理中广泛应用的BERT模型将文本描述转换为令牌序列并提取词向量;设置了一个固定值L来控制句子长度,在将文本描述转化为令牌序列的过程中,对于长度小于L的序列,进行补零操作;对于长度超过L的序列,取前L个令牌;得到固定长度的令牌序列;然后将它们输入BERT模型,得到文本特征表示;为了提取文本描述对应的各个分支的特征表示,首先将词向量的维度从扩展到,从而由后续的卷积神经网络处理;接下来,使用一个卷积层和批范数操作获得文本低层特征;接着,通过聚合文本低层特征,获得文本低层特征向量;最后,使用由卷积和残差组成的模块化网络获得与车辆图像对应的多尺度多视角文本特征:; 步骤5、使用掩码双向匹配损失进行多尺度多视角跨模态特征对齐; 步骤6、计算多尺度多视角特征进行测试。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经开区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。