广东工业大学陈静获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东工业大学申请的专利一种基于三重注意力机制的自动驾驶感知方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119888654B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411855405.3,技术领域涉及:G06V20/56;该发明授权一种基于三重注意力机制的自动驾驶感知方法是由陈静;施玲玲;王铭鹏;赵韦杭设计研发完成,并于2024-12-17向国家知识产权局提交的专利申请。
本一种基于三重注意力机制的自动驾驶感知方法在说明书摘要公布了:本发明属于深度学习技术领域,具体公开了一种基于三重注意力机制的自动驾驶感知算法,首先将激光雷达扫描到的场景原始点云数据输入到特征编码网络进行划分为一个个的pillars,将3维点云数据转换成2维的伪图像;然后将转变为2D的伪图输入到2DBackbone中进行特征提取,得到多尺度多维度的特征;最后进行上采样拼接后再送入到检测头进行检测任务。本发明提出的DSPE模块通过引入三重注意力机制,显著增强了对3D小目标检测中细粒度信息的提取能力。DSPE不仅改善了传统最大池化操作造成的特征信息丢失问题,还能有效捕捉每个支柱内点之间的空间相关性、通道间的特征交互以及体素间的上下文依赖关系,大幅提升系统的检测精度和速度。
本发明授权一种基于三重注意力机制的自动驾驶感知方法在权利要求书中公布了:1.一种基于三重注意力机制的自动驾驶感知方法,其特征在于:包括特征编码网络、2Dbackbone以及检测头三个部分,包括以下步骤: 步骤一:将激光雷达扫描到的场景原始点云数据输入到特征编码网络进行划分为一个个的pillars,从而将3维点云数据转换成2维的伪图像,具体地, (1)将3D点云数据按照xoy平面,均匀地划分成一个个网格,每个网格所代表的长方体即为一个pillar,pillar的个数设置为M,落在一个网格中的点则视为在一个pillar中;在KITTI数据集中,点的特征由一个四维向量表示,(x,y,z,r)分别对应点的xyz轴上的坐标和反射强度,将每个点用一个C=10维的向量表示特征,分别为(x,y,z,r,xc,yc,zc,xp,yp,zp),其中,x,y,z,r表明的是该点云的真实坐标信息和反射强度,xc,yc,zc表示每个点相对于体素质心的位置偏移,xp,yp,zp表示每个点相对于其所属体素中心的坐标偏移; (2)设定一个超参数N对每个pillars中的点的数量加以限制,如果一个pillars中点的数量超过N,则随机采样N个点,如果少于N,则用0来填充;这样原来的3D点云数据就构成了一个(P,N,C)的张量,其中C=10,代表每个点的特征通道数,P代表pillars的个数,N代表点的数量,到此完成了点云数据的张量化; (3)从步骤(2)完成点云的张量化后得到P1∈P×N×C的数据,接着经过一个简化版的PointNet,进行升维得到P1∈(P,N,D),其中D=64,目前的点云每个点的特征通道数; (4)进行point之间的注意力机制:首先将P1∈(P,N,D)经过位置转换变为T2∈(N,P,D),应用多头注意力机制计算点与点之间的相似度并进行加权处理,生成加权后的特征矩阵O∈N×P×D;接着将维度变换回来变成O∈(P,N,D)并取第一个得到O1∈(P,1,D),将P1∈(P,N,D)经过位置转换变为H2∈(D,P,N),应用多头注意力机制计算每个点的通道之间的相似度并进行加权处理,生成加权后的特征矩阵K∈D×P×N;再接着将维度变换回来变成K∈(P,N,D)并取第一个得到K1∈(P,N,1),将O1∈(P,1,D)和K1∈(P,N,1)进行逐元素相乘操作得到融合后的特征矩阵KO1∈(P,N,D),将原始特征矩阵P1与融合后的特征矩阵KO1相乘,得到加权特征矩阵KOP1∈P×N×D;最后,将加权特征矩阵KOP1输入到SENet模块中,以进一步优化特征表达; (5)经过步骤(4)后,对加权特征矩阵KOP1实施最大池化操作,以提取最具代表性的特征,并减少特征维度,经过此步骤后,得到降维后的特征矩阵KOP2∈P×D;同时,对原始特征矩阵P1也应用最大池化操作,以提取全局特征G1∈P×D,将全局特征G1和降维后的特征KOP2进行逐点相加,生成综合特征矩阵F∈P×D;最后将点特征分散回它们的pillars中,得到一个(D,H,W)的张量,即一个伪图像,H,W分别代表伪图像的长和宽,生成伪图像以便送入接下来的2Dbackbone进行特征提取; 步骤二:将转变后的2D的伪图输入到2DBackbone中进行特征提取,主要是通过将输入进来的特征图进行下采样为三个不同大小不同通道的特征图,从而得到多尺度多维度的特征后,进行上采样拼接; 步骤三:再送入到检测头进行预测任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东工业大学,其通讯地址为:510006 广东省广州市东风东路729号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。