Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京航空航天大学童超获国家专利权

北京航空航天大学童超获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京航空航天大学申请的专利基于层级式分组聚合的三维语义场景补全方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540454B

龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411603742.3,技术领域涉及:G06T17/00;该发明授权基于层级式分组聚合的三维语义场景补全方法是由童超;王煜;邢震宇;朱守泰设计研发完成,并于2024-11-11向国家知识产权局提交的专利申请。

基于层级式分组聚合的三维语义场景补全方法在说明书摘要公布了:本发明提出了基于层级式分组聚合的三维语义场景补全方法。该模型提出了一种新的双分支结构。显式约束分支从整体三维场景特征开始,关注场景的区域方面,并将显式相似的特征聚合到分组的区域特征中。隐式扩散分支从查询建议网络输出的可见体素查询建议开始,重点关注场景中对象的细节,并学习对象的隐式细粒度特征。还提出了层级式分组模块,该模块将三维空间划分为多个子区域,并对每个区域内的体素特征进行相似度计算和聚合,进而生成紧凑的区域特征表示。这种分组方式能够聚焦于场景中特定物体的局部区域,避免了远处独立分布对象特征的相互干扰,从而提取出更为详细和精确的语义特征。

本发明授权基于层级式分组聚合的三维语义场景补全方法在权利要求书中公布了:1.一种基于层级式分组聚合的三维语义场景补全方法,其特征在于,包括以下步骤: 步骤S1:数据准备;步骤S1包括步骤S11与步骤S12; 步骤S11:数据标注构建; 步骤S12:深度提取; 步骤S2:计算显式约束分支模块特征; 步骤S21:提取显式体素特征; 步骤S22:利用层级式分组模块平衡冗余特征; 步骤S3:计算隐式扩散分支模块特征; 步骤S4:计算融合特征; 步骤S5:计算多尺度预测结果与损失函数约束设置; 步骤S11中,首先收集SemanticKITTI数据集,遵循MonoScene的设置使用cam2的大小为1226×370的RGB图像作为输入,并从左侧裁剪图像为1220×370;利用原始数据集中提供的点云标注生成11分辨率256×256×32的体素类别标注,12分辨率128×128×16的体素类别标注以及18分辨率32×32×4的体素类别标注,用于后续训练; 步骤S12中,遵循VoxFormer的设置使用预训练的MobileStereoNet提取RGB图像的深度值,输出的二维图像特征F2D; 步骤S21中,显式约束分支从步骤S12的输出的二维图像特征F2D中提取显式体素特征;利用Monoscene中的Flosp模块将二维图像特征投影到三维体素中;Flosp的方法涉及将三维体素的中心投影到多尺度二维特征图上,并对相应的特征进行采样;通过层级式分组模块聚合Flosp模块输出的3D特征FFlosp, FFlosp=FlospF2D Fregion=HGMFFlosp; 步骤S22中,层级式分组模块HGM基于分层架构,将场景划分为区域组,并在每个相对较小的区域内聚合特征,层次式分组模块包括下采样、分组子块、上采样三部分;在每个下采样阶段中,采用基于GumbelSoftmax注意力算法计算的体素特征相似度的新颖下采样,从而紧凑地聚合特征;首先将当前场景沿三个正交方向均匀划分为八组,使每个子区域的长度、宽度和高度都是前一个的一半,然后使用分组子块压缩每个子区域内的特征,并聚合该区域中相似的体素特征,最后,使用DDR块进行相邻区域之间的特征交互;在分组子块中,按比例将每个子区域内的体素特征划分为体素标记和聚合标记,分组子块将分割的体素标记{vl}和聚合标记{al}作为输入,其中l表示下采样层的索引,根据嵌入空间中两个标记的相似性聚合子区域内的相似特征,从而形成更紧凑的区域特征,使用GumbelSoftmax运算计算体素标记和聚合标记之间的相似性矩阵Al,用以下公式表示: 其中,ai和vj分别是查询和键,l是模块的层编号,Wq和Wk是可学习的线性投影权重,Ml是序列长度,γi是从Gumbel0,1分布中独立随机采样获得的,随后使用argmax操作进行赋值计算分配矩阵在合并相似特征后,获得更紧凑的体素特征,用以下公式进行表示特征更新过程: 其中,Wo和Wv是可学习的线性投影权重;在层级式分组模块的上采样阶段中,设计了相同数量的上采样层,将区域特征恢复到输入分辨率,使用三维转置卷积进行上采样,并使用DDR块进行相邻区域之间的特征交互,以相同的分辨率在相应的上采样层和下采样层之间引入了跳跃连接; 步骤S3中,隐式扩散分支实现扩散二维图像中的隐式体素特征,使用查询建议网络从深度估计图和相机参数中预定义了一组可学习的查询建议,基于这组查询使用可变形交叉注意力DCA从二维特征图中学习感兴趣区域的特征,隐式扩散分支的计算过程用以下公式表示,其中Qp表示查询建议,DCAQ,K,V表示可变形交叉注意操作,其中Q,K,V是需要填入的参数; Fvisible=DCAQp,F2D,F2D Fobject=HGMFvisible+Fmask; 步骤S4中,特征扩散模块接受显式约束分支的区域特征Fregion和隐式扩散分支的对象特征Fobject,并通过多尺度特征扩散将这两类特征聚合为完整的三维场景特征F3D; 步骤S5中,使用多尺度预测头来生成三维场景补全结果,首先,将显式约束分支的结果即步骤二的输出输入到低分辨率预测头中,以获得其中H、W、Z表示场景的原始维度,其次,将显式约束分支和隐式扩散分支的结果连接起来,通过AIC模块和ASPP模块聚合特征,即步骤S4的输出,以便在分组区域之间进行特征交互;最后,将交互结果输入到原始分辨率预测头中,得到由于Ylow侧重于紧凑的分组区域特征,因此使用12分辨率真值标注来监督Ylow;Ylow的预测只发生在训练阶段;使用加权交叉熵损失LCE训练两个场景补全结果,使用以下公式计算: 其中Nv表示体素数量,cM表示类别数量,ωc表示类别权重,和ync分别表示真值标注和预测结果,在训练过程中使用了MonoScene中提出的场景类亲和性损失和最终损失是六项损失的总和,表示为以下公式,其中λ是低分辨率损失函数的自定义系数,

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。