东南大学李旭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利基于可变形注意力机制的全景图像拼接方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116245714B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310154588.5,技术领域涉及:G06T3/4038;该发明授权基于可变形注意力机制的全景图像拼接方法是由李旭;刘鑫;王贲武设计研发完成,并于2023-02-23向国家知识产权局提交的专利申请。
本基于可变形注意力机制的全景图像拼接方法在说明书摘要公布了:本发明公开了一种基于可变形注意力机制的全景图像拼接方法,将多视角图像送入主干网络后获得多尺度特征图;生成可学习的BevQueries模型,随机生成栅格形的BevQueries,BevQueries的每个格子都代表了实际的物理尺寸和对应一个自车坐标系的三维坐标,通过注意力机制在多视角的多尺度图片中查询和聚合相关特征信息,经过转置卷积生成全景鸟瞰图;最后根据获得的BevQueries模型进行模型训练,使用MS‑SSIMLoss来学习图形的结构,在MS‑SSIMLoss降低到设定阈值时,学习边缘特征和修正图像的颜色及去除图像噪声,获得全景图像。本发明不仅可以构建更加平滑和较少畸变和失真的全景鸟瞰图,同时对于在复杂环境中的相机内外参漂移具有较强的鲁棒性,具有较快的计算速度。
本发明授权基于可变形注意力机制的全景图像拼接方法在权利要求书中公布了:1.基于可变形注意力机制的全景图像拼接方法,其特征在于,包括以下步骤: S1,多视角图像的多尺度特征提取:将多视角图像送入主干网络后获得多尺度特征图,多尺度特征图中特征点的位置信息由特征层位置编码与基于三角函数公式计算的位置编码相加得出; S2,生成可学习的Bev Queries模型:随机生成栅格形的Bev Queries, Bev Queries的每个格子都代表了实际的物理尺寸和对应一个自车坐标系的三维坐标,通过注意力机制在多视角的多尺度图片中查询和聚合相关特征信息,经过转置卷积生成全景鸟瞰图;具体为: 随机初始化Bev Queries,分别是Bev Queries的高,宽和通道数,Bev Queries被分为个格子,每个格子都代表实际的物理尺寸和对应一个自车坐标系的三维坐标x, y, z,所有的格子都会共享一个0左右的Z坐标; Bev Queries的每个格子都会查询基于几何先验和注意力机制生成的相关特征信息,根据查询结果不断地更新Bev Queries,最后将Bev Queries经过转置卷积生成全景鸟瞰图; Bev Queries每个格子查询会注意的特征范围包括固定区域和变形采样的区域:固定区域指以为中心的区域,每个格子将会查询的固定区域的相关特征是,其中分别是视角的个数,特征图尺度的个数,通道数,采样区域的高,采样区域的宽;指每个格子在不同视角和不同尺寸特征图中的二维坐标;变形采样的区域指用Bev Queries通过线性映射生成一组位置偏移的区域; S3,模型训练:根据步骤S2获得的Bev Queries模型,使用MS‑SSIM Loss来学习图形的结构,在MS‑SSIM Loss降低到设定阈值时,采用L2 Loss损失函数,用来学习边缘特征和修正图像的颜色,最后使用L1 Loss损失函数,去除图像噪声,获得全景图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210096 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励