电子科技大学;喀什地区电子信息产业技术研究院候少麒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉电子科技大学;喀什地区电子信息产业技术研究院申请的专利一种自注意力下空间自感知的视觉场景识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119206595B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411219130.4,技术领域涉及:G06V20/50;该发明授权一种自注意力下空间自感知的视觉场景识别方法是由候少麒;武辰宇;秦泽邦;殷光强;刘学婷;周楠;安俊企;张钰淞设计研发完成,并于2024-09-02向国家知识产权局提交的专利申请。
本一种自注意力下空间自感知的视觉场景识别方法在说明书摘要公布了:本发明涉及机器人自主导航与视觉识别技术领域,公开了一种自注意力下空间自感知的视觉场景识别方法,采用主要由ViTbackbone和特征聚合模块TokenModule两部分所构成的S3VPR模型实现,包括下述步骤:1对于给定的输入图像,利用ViTbackbone提取基础特征,得到特征图,而后形成新特征图;2对新特征图进行reshape操作,将其从二维特征图转换为三维特征图;3使用特征聚合模块TokenModule先沿空间维度对三维特征图进行处理得到空间交互特征图,然后再沿通道维度进行处理得到通道交互特征图,而后进一步处理得到全局描述子;4利用相似度算法将查询图像的全局描述子和数据库中所有数据库图像的全局描述子进行一一比较,找出所有和查询图像归属同一场景的数据库图像。
本发明授权一种自注意力下空间自感知的视觉场景识别方法在权利要求书中公布了:1.一种自注意力下空间自感知的视觉场景识别方法,其特征在于:采用主要由ViTbackbone和特征聚合模块TokenModule两部分所构成的S3VPR模型实现,包括下述步骤: 1对于给定的输入图像q,利用ViTbackbone提取基础特征,得到wh+1个token向量组成的特征图Fcls,且Fcls∈Rwh+1×c,而后形成新特征图F2D,且F2D∈Rwh×c,其中,w,h分别表示输入图像的宽和高,c表示token向量的维度,输入图像q包括查询图像和数据库图像; 2对新特征图F2D进行reshape操作,将其从二维特征图转换为三维特征图F,且F∈Rw×h×c; 3使用特征聚合模块TokenModule先沿空间维度对三维特征图F进行处理得到空间交互特征图Fsi,且Fsi∈Rw×h×c,然后从通道维度对空间交互特征图Fsi进行处理得到通道交互特征图Fci,且Fci∈Rw×h×c,而后进一步处理得到全局描述子z;所述特征聚合模块TokenModule包括主体部分TokenBlock和特征聚合组件GeMhead,主体部分TokenBlock包括从空间维度上增强特征图的显著特征的表达能力的Spaceinteraction模块和从通道维度上增强特征图的显著特征的表达能力的Channelinteraction模块; 所述Spaceinteraction模块包括Spaceself-awareness单元和Spacefusion单元,且在空间维度上Spaceinteraction模块对三维特征图F进行处理的过程包括: 3.1.1使用Spaceself-awareness单元挖掘三维特征图F内部的视觉结构属性,计算出通道式空间自感知特征图Fhp,且Fhp∈Rw×h×c×p×p;其中,p×p为感知区域的宽和高尺寸; 3.1.2使用Spacefusion单元对通道式空间自感知特征图Fhp进行降维操作; 3.1.3经步骤3.1.2后,通过“残差连接”的方式将降维后的新三维特征图Fsf与三维特征图F融合,且Fsf∈Rw×h×c,得到空间交互特征图Fsi,且Fsi∈Rw×h×c; 所述Channelinteraction模块主要由中间带有激活函数的两个全连接层组成,且在通道维度上对空间交互特征图Fsi的处理过程包括: 3.2.1对于输入的空间交互特征图Fsi,使用第一个全连接层对其进行编码操作,并将Fsi的通道数降维到原来的1r; 3.2.2使用ReLU激活函数增强编码特征的非线性表达; 3.2.3使用第二个全连接层执行解码操作,同时将通道特征的维度还原; Channelinteraction模块在通道维度上对空间交互特征图Fsi的处理时采用下述公式: Fci=W2σW1Fsi+b1+b2,Fci∈Rw×h×c2; 式中,Fci为通道交互特征图,σ表示ReLU激活函数;W1,W2与b1,b2分别是两个全连接层的权重参数与归纳偏置;r是缩放因子; 4利用相似度算法将查询图像的全局描述子z和数据库中所有数据库图像的全局描述子z进行一一比较,找出所有和查询图像归属同一场景的数据库图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学;喀什地区电子信息产业技术研究院,其通讯地址为:611731 四川省成都市高新区(西区)西源大道2006号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励