浙江工业大学产思贤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利基于模态间隐式空间增强和时空交互编码的3D目标检测方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119723327B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411748988.X,技术领域涉及:G06V20/10;该发明授权基于模态间隐式空间增强和时空交互编码的3D目标检测方法和装置是由产思贤;段蓓蓓;范兴刚;毛家发;白琮设计研发完成,并于2024-12-02向国家知识产权局提交的专利申请。
本基于模态间隐式空间增强和时空交互编码的3D目标检测方法和装置在说明书摘要公布了:基于模态间隐式空间增强和时空交互编码的3D目标检测方法和装置,其方法包括:获取训练数据并构建3D目标检测架构;通过特征提取网络分别获取RGB图像特征和点云特征,将这些特征输入到隐式空间增强融合编码网络中生成包含丰富几何信息的鸟瞰视图图像特征;通过时空交互式特征融合网络,在空间和时间维度上融合图像鸟瞰特征和点云鸟瞰特征以获得最终的多模态融合特征;将所述融合特征送入分类头,实现目标的检测与识别。本发明通过充分挖掘LiDAR点云和RGB图像的互补特性进行高精度目标检测。
本发明授权基于模态间隐式空间增强和时空交互编码的3D目标检测方法和装置在权利要求书中公布了:1.基于模态间隐式空间增强和时空交互编码的3D目标检测方法,其特征在于,包括以下步骤: S1:获取一一对应的多视角RGB图像数据与LiDAR点云数据作为训练样本,构建3D目标检测架构,所述3D目标检测架构包括特征提取网络、隐式空间增强融合编码网络、时空交互式特征融合网络以及分类头组成; S2:将训练样本中一组对应的多视角RGB图像数据与LiDAR点云数据输入到特征提取网络中进行特征提取,得到RGB图像特征与LiDAR点云特征; S3:所述隐式空间增强融合编码网络包括初步交互单元与精细交互单元,在所述初步交互单元中利用相机的内参矩阵和外参矩阵将LiDAR点云数据投影到RGB图像坐标系中,并通过可变交叉注意力机制动态增强RGB图像特征的空间深度信息,在精细交互单元中通过残差网络将原始RGB图像特征与增强后的RGB图像特征进行融合,得到鸟瞰视角下的RGB图像特征; S4:分别将LiDAR点云特征、鸟瞰视角下的RGB图像特征输入到时空交互式特征融合网络中,所述时空交互式特征融合网络包括空间融合单元和时间融合单元,在所述空间融合单元将LiDAR点云特征、鸟瞰视角下的RGB图像特征应用可变形交叉注意力后得到初步鸟瞰特征,在所述时间融合单元使用可变形自注意力机制对初步鸟瞰特征进行聚合得到最终的融合特征; 所述的空间融合单元包含查询生成与位置编码层、可变形交叉注意力层以及残差层;所述查询生成与位置编码层生成与ROI网格中特定空间位置对应的查询向量,并对其进行位置编码,以捕捉这些位置的相对空间信息;所述可变形交叉注意力层利用这些查询向量来融合点云鸟瞰特征和图像鸟瞰特征;最后,所述残差层进行残差连接得到初步鸟瞰融合特征; 所述的时间融合单元包含初始化层、自注意力更新层、前馈网络层以及融合层;初步鸟瞰融合特征在所述初始化层利用自注意力机制初始化查询向量;接着,在所述自注意力更新层采用可变形注意力机制将历史帧的编码特征融入到查询向量中更新查询向量;更新后的查询向量经过所述前馈网络层处理进一步丰富其特征表示,最后通过所述融合层融合时序信息得到最终的鸟瞰融合特征; S5:将所述最终融合特征输入到分类头中得到3D目标检测结果,基于所述检测结果构建损失函数,当损失函数满足设定条件后,保存3D目标检测架构的当前参数,得到3D目标检测模型; S6:将一组对应的多视角RGB图像数据与LiDAR点云数据输入到训练好的3D目标检测模型中得到目标检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励