东南大学越宏哲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于扩散模型的场景级合成点云增强的语义分割方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119992082B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411963037.4,技术领域涉及:G06V10/26;该发明授权一种基于扩散模型的场景级合成点云增强的语义分割方法和系统是由越宏哲;王骞设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种基于扩散模型的场景级合成点云增强的语义分割方法和系统在说明书摘要公布了:本发明公开了一种基于扩散模型的场景级合成点云增强的语义分割方法和系统,旨在解决深度学习中点云训练样本不足的问题。包括以下步骤:首先,通过扩散模型基于文本生成高质量全景图像;接着,利用深度学习视觉变换器对全景图像进行深度预测,并结合SAM智能标注方法进行语义分割标注;随后,采用柱面投影方法,将深度信息和语义标签映射到全景图像上,生成包含空间坐标、RGB颜色值和语义标签的三维点云。然后将生成的合成点云与真实点云相结合,用于训练深度学习模型,从而提升语义分割的精度。最后,通过训练后的模型对目标场景进行语义分割预测,生成语义标签,并将分割结果导入BIM软件完成三维模型重建,助力建筑的智能化运维与监测。
本发明授权一种基于扩散模型的场景级合成点云增强的语义分割方法和系统在权利要求书中公布了:1.一种基于扩散模型的场景级合成点云增强的语义分割方法,其特征在于,包括以下步骤: S1、对待重建的真实点云场景进行扫描获得真实点云并进行预处理,所述真实三维点云包括每个点的XYZ坐标、RGB颜色信息; S2、构建并训练扩散模型,具体是:基于全景分支和透视分支的双分支方法,将全景分支作为扩散模型的输入端;以噪声全景潜在图为输入,透视分支生成与场景不同部分相对应的噪声透视潜在图,两个分支之间通过等距透视投影注意力EPPA机制实现全景图和透视图的特征融合,使用低秩适配LoRA层,自适应地调整模型的权重,同时在两个分支内,使用带有跳跃连接的U-Net结构,扩散模型最终输出高保真全景图; S3、利用扩散模型获得高保真全景图,对全景图进行语义分割标注,生成全景图的语义标签; S4、构建并训练基于视觉变换器ViT的深度预测模型,具体是:以全景图为输入、对应的深度图为输出,训练得到深度预测模型;训练过程中通过对输入全景图划分为小块网格,每个小块被展平并通过学习的权重矩阵和偏置参数线性变换为嵌入,嵌入的标记通过自注意力机制进行处理,经过若干个自注意力层处理后,最终的深度预测通过回归头映射变换器的输出深度图; S5、利用深度预测模型获得深度图,采用柱面投影方法,将深度图和语义标签映射到全景图像上,生成包含空间坐标、RGB颜色值和语义标签的合成三维点云数据; S6、将合成三维点云添加到真实三维点云,获得混合点云数据,同时构建深度学习语义分割网络,以混合点云数据为输入、语义分割结果为输出训练深度学习语义分割网络,得到深度学习语义分割模型,利用深度学习语义分割模型对待重建的真实点云场景分割,基于分割结果构建BIM模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:210018 江苏省南京市玄武区四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励