湖南大学张辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南大学申请的专利一种基于注意力机制的物体6D位姿估计方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120318325B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510780227.0,技术领域涉及:G06T7/73;该发明授权一种基于注意力机制的物体6D位姿估计方法及系统是由张辉;孔垂旺;陈为立;陈波;李康;樊叶心;江一鸣;王耀南设计研发完成,并于2025-06-12向国家知识产权局提交的专利申请。
本一种基于注意力机制的物体6D位姿估计方法及系统在说明书摘要公布了:本发明涉及计算机视觉技术领域,具体为一种基于注意力机制的物体6D位姿估计方法及系统;物体6D位姿估计方法中利用了6D位姿估计网络,6D位姿估计网络包括目标检测模块、主干网络模块和位姿预测模块。在目标检测模块中,根据目标所在位置对RGB图像进行放大处理。主干网络模块采用全新ResNet变体,整合了像素级小波多分支注意力机制与双通道上采样注意力机制,实现对目标在空间域和小波域中多尺度特征的高效捕捉与融合。位姿预测模块则利用神经网络直接预测6D位姿。本发明不仅为提升遮挡鲁棒性提供了创新思路,更构建了一种基于空频域特征融合的端到端物体6D位姿估计新范式。
本发明授权一种基于注意力机制的物体6D位姿估计方法及系统在权利要求书中公布了:1.一种基于注意力机制的物体6D位姿估计方法,其特征在于,包括如下步骤: S1、搭建6D位姿估计网络,6D位姿估计网络包括目标检测模块、主干网络模块和位姿预测模块,主干网络模块内嵌像素级小波多分支注意力机制和双通道上采样注意力机制;将数据集划分为训练集和测试集; S2、从训练集选择一张RGB图像输入到目标检测模块中,识别RGB图像内预定的目标物体,将包含目标物体在内的RGB图像局部放大至固定尺寸,得到目标物体放大图像,并输出目标物体的2D像素坐标图; S3、将目标物体放大图像输入到主干网络模块中,得到目标物体的表面区域注意力图、物体坐标图和掩码图,然后将物体坐标图和目标物体的2D像素坐标图进行拼接,得到密集对应关系图; S4、将表面区域注意力图和密集对应关系图拼接后输入到位姿预测模块中,得到目标物体预测的6D位姿信息; S5、依据目标物体预测的6D位姿信息、真实的6D位姿信息、表面区域注意力图、物体坐标图以及掩码图构建总损失函数,循环S2至S5,最小化总损失函数,直至总损失函数收敛,得到训练后的6D位姿估计网络; S6、利用测试集对训练后的6D位姿估计网络进行测试,得到物体6D位姿信息; 所述像素级小波多分支注意力机制的数据处理步骤具体如下: A1、将输入特征沿着输入通道分为两部分,分别为空间域特征和特征; A2、对特征进行离散小波变换得到小波域特征; A3、小波域特征经过一个的卷积层和激活函数得到特征图; A4、将特征图输入到多分支位置注意力机制中,得到特征图,特征图经过卷积层和激活函数,得到位置特征; A5、小波域特征经过一个的卷积层和激活函数得到特征图; A6、将特征图输入到与多分支位置注意力机制并行设置的多分支通道注意力机制中,得到特征图,特征图经过卷积层和激活函数,得到通道特征; A7、将位置特征和通道特征相加得到特征,特征经过一个的卷积层和激活函数得到特征; A8、对特征使用逆小波变换,得到特征,然后将空间域和特征进行拼接并且通过一个的卷积层和激活函数,得到融合特征; A9、输入特征通过一个的卷积层之后再与融合特征相加,得到输出特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。