长春理工大学詹伟达获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长春理工大学申请的专利一种面向室外场景的高效多视图立体重建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119516138B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411620181.8,技术领域涉及:G06T17/05;该发明授权一种面向室外场景的高效多视图立体重建方法及系统是由詹伟达;韩悦毅;刘大鹍;朱德鹏;蒋一纯;韩登;郭金鑫;邢健设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。
本一种面向室外场景的高效多视图立体重建方法及系统在说明书摘要公布了:本发明公开了一种面向室外场景的高效多视图立体重建方法及系统,属于多视图三维重建领域,具体步骤为:准备用于模型训练的多视图立体重建数据集;构建包括基于大核注意力的自适应特征提取转换器模块、代价正则化模块以及深度估计模块的多视图立体重建网络;对网络模型进行训练和微调,获得最终模型;搭建多视图立体重建系统和设备;本发明既能够解决现有多视图立体重建方法在面对室外大规模场景时重建结果精确度差、完整度低的问题,又能够减少多视图立体重建的训练推理时间和计算代价,为室外大规模场景图像数据在多视图三维重建领域的应用以及三维重建技术的发展奠定重要基础。
本发明授权一种面向室外场景的高效多视图立体重建方法及系统在权利要求书中公布了:1.一种面向室外场景的高效多视图立体重建方法,其特征在于,包括如下步骤: 步骤1,准备数据集:准备第一多视图立体重建数据集和第二多视图立体重建数据集,分别将两个数据集划分为训练数据集和测试数据集;训练数据集用来训练网络模型,测试数据集用来评估模型训练效果; 步骤2,构建网络模型:网络由主干网络、基于大核注意力的自适应特征提取转换器模块、代价正则化模块以及深度估计模块构成; 所述步骤2中主干网络为特征金字塔特征提取网络,用于提取输入参考图像和源图像的多尺度特征; 所述基于大核注意力的自适应特征提取转换器模块包括自适应大核注意力块、混合前馈神经网络块、线性交叉注意力块和上采样模块; 所述代价正则化模块,通过将三维卷积核替换成三维自适应大核注意力,在不增加模型参数和计算复杂度的情况下扩大感受野,使模型能够更好地捕捉场景中的全局信息,从而提高立体重建的准确性; 所述深度估计模块利用最大概率深度估计,对每个像素位置,从概率体中选择具有最高概率值的深度值,将其作为深度估计图中该像素位置的深度值; 所述步骤2中自适应大核注意力块,利用不同膨胀系数的多尺度卷积核组合成大尺寸卷积核,使模型在不牺牲性能的前提下,有效减少计算代价,提高模型的计算效率,在此基础上,通过引入可变形卷积,使大尺寸卷积核自适应的学习到不同尺度的多视图目标,获得更大的感受野,使得模型能够更好地理解室外场景下的目标上下文信息,从而提高对复杂特征的提取能力; 所述混合前馈神经网络块,更好地聚合全局和多尺度的局部信息,并将层归一化的设计扩展到一般形式,促进了跳跃连接的优化,提升网络特征提取能力; 所述线性交叉注意力块,使网络能够在不同视角图像之间学习到图像间的特征关联,帮助模型更好地理解物体的空间结构,提高立体重建的准确性和稳定性; 步骤3,训练网络模型:将步骤1准备好的数据集输入到步骤2中构建好的网络模型中进行训练;通过最小化网络的输出与标签之间的损失,达到更好的深度预测结果; 步骤4,筛选最优网络模型;使用测试数据集作为输入,评估并筛选最优网络模型参数; 步骤5,微调网络模型;用第二多视图立体重建数据集对网络模型进行微调,使模型从光照可控的室内场景泛化到室外大规模场景; 步骤6,保存网络模型;将网络训练完成后,保存最优的网络参数,之后用将要三维重建的多视图场景图像输入到网络中就得到预测的深度图,通过深度滤波和融合操作,得到重建后的三维点云。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春理工大学,其通讯地址为:130012 吉林省长春市朝阳区卫星路7089号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励