江苏大学饶中钰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏大学申请的专利一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法、模型及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116863241B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310915325.1,技术领域涉及:G06V10/764;该发明授权一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法、模型及设备是由饶中钰;蔡英凤;王海;李祎承;刘擎超;陈龙;廉玉波;董钊志设计研发完成,并于2023-07-25向国家知识产权局提交的专利申请。
本一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法、模型及设备在说明书摘要公布了:本发明公开了一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法、模型及设备,采用基于大核卷积的编码方式,提高模型的长距离建模能力。同时,为有效提升视角转换的准确度,本发明提出了一种结合维度转换以及空间转换的视角转换模块,并采用双注意力机制结合转换前的视角进行优化,有效提升模型预测的准确度,改善预测细节。采用维度与空间结合的鸟瞰图特征转换模块,将前置图像的特征图通过维度转换以及空间转换两个模块将其投影到俯视图空间,保留了特征在空间以及维度上的完整性。采用一种交叉注意力机制,通过结合前置特征图优化转换得到的俯视特征图,加强俯视特征图对于重点区域的特征表达,提高整体模型的准确性。
本发明授权一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法、模型及设备在权利要求书中公布了:1.一种道路场景下基于计算机视觉的端到端语义鸟瞰图生成方法,其特征在于,包括如下: S1,制作基于视觉的语义鸟瞰图数据集; S2,搭建视觉语义鸟瞰图端到端生成网络模型;包括五部分:1、用于提取图像特征的编码器模块;2、用于将前置视角特征图投影到俯视视角特征图的视角转换模块;3、结合前置特征图用于加强俯视视角特征的双层交叉注意力模块;4、基于多帧图像的时序调整模块; 5、用于构造完整鸟瞰图输出的解码器模块; 所述S2中前置视角特征图投影到俯视视角特征图的视角转换模块,包括两部分:维度层面的视角转换以及空间层面的视角转换;具体计算方法如下: 针对t时刻的特征图Ft,首先利用维度特征注意力机制,对特征图Ft针对不同维度的特征图上进行平均池化操作得到各个维度上的平均向量ca∈32,32,1,并经过一层全连接层,随后将得到的特征输入到激活函数上,得到不同维度上的权重向量Mc∈1,1,512,计算公式如下: ca=AvergepoolcFt 1Mc=σMlpca 2其中Mlp代表全连接操作,Avergepoolc代表在维度上进行平均池化,σ代表softmax激活函数; 然后将其与特征图X进行相乘得到突出不同维度后的特征图,随后采用逐点卷积对其进行维度层面的变换,得到维度上变换后的特征图Xc1,为抑制过拟合情况出现,在此处添加了短连接部分,具体计算公式如下: Xc=Xc1+X 3其中FDW代表深度卷积操作; 接着利用空间注意力机制,对空间上的不同像素点进行平均池化操作得到平均向量sa∈1,1,512,然后权重将其进行维度展开,并通过一次全连接层其计算公式如下: sa=AvergepoolsXc 4Ms=σMlpReshapesa 5其中Reshape代表展平操作;随后将得到的注意力特征图Ms∈32*32,1与输入特征图Xc进行相乘,得到加权调整后的特征图,随后利用维度调整操作,将得到特征图维度调整为原始X”∈32,32,1,最后利用13×13尺寸的大核深度卷积模块进行处理,同样为抑制过拟合,添加了短连接模块,从而得到最终转换后的特征图Xbev,具体计算过程可由下列公式表示: Xbev=Xc+X” 7其中FDW代表深度卷积,Reshapeb代表复原为原始尺寸操作; S3,对搭建的模型进行训练; S4,利用训练好的端到端语义鸟瞰图生成模型实时生成鸟瞰图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏大学,其通讯地址为:212013 江苏省镇江市京口区学府路301号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励