中国科学院地球环境研究所刘志恒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院地球环境研究所申请的专利基于视觉状态空间和频域增强的遥感影像滑坡识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121170486B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511352815.0,技术领域涉及:G06V10/774;该发明授权基于视觉状态空间和频域增强的遥感影像滑坡识别方法是由刘志恒;唐亚明;方然可;赵富萌;汪泓涛;刘晓倩设计研发完成,并于2025-09-22向国家知识产权局提交的专利申请。
本基于视觉状态空间和频域增强的遥感影像滑坡识别方法在说明书摘要公布了:一种基于视觉状态空间和频域增强的遥感影像滑坡识别方法,包括如下步骤:构建基于视觉状态空间和频域增强的遥感影像滑坡识别的编码子网络;构建基于视觉状态空间和频域增强的遥感影像滑坡识别的解码子网络;构建基于视觉状态空间和频域增强的遥感影像滑坡识别的识别子网络;构建基于视觉状态空间和频域增强的遥感影像滑坡识别网络;生成训练集、验证集和测试集;训练遥感影像滑坡地质灾害识别网络;识别遥感影像滑坡地质灾害范围;本发明提出融合空间与频域特征的滑坡识别网络结构,设计具有远程依赖感知能力的视觉状态空间模块、分组空间上采样模块,提出基于频域增强模块,提高边界识别精度,能够捕捉遥感图像中不同方向上的长距离依赖关系,增强网络对滑坡区域空间结构的理解力,尤其对地形复杂、边界模糊的滑坡区域具有较强识别能力。
本发明授权基于视觉状态空间和频域增强的遥感影像滑坡识别方法在权利要求书中公布了:1.一种基于视觉状态空间和频域增强的遥感影像滑坡识别方法,其特征在于,包括: 构建基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络,提取遥感影像上滑坡的特征图,包括: 步骤1,搭建基于视觉状态空间和频域增强的遥感影像滑坡识别方法编码子网络,其结构依次为:下采样1、下采样2、下采样3、下采样4和下采样5; 步骤1.1,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络的下采样1模块; 所述下采样1模块包括第一卷积层、视觉状态空间模块VSSBlock和最大池化层;其中,第一卷积层用于调整图像维度,便于后续计算;VSSBlock提取多层次空间与语义特征;最大池化层通过缩小特征图尺寸,减少后续层的参数和计算量,加速训练; 所述视觉状态空间模块VSSBlock,由两个并行分支组成,即Xb和Xt; 在分支Xt中,特征X将首先经过线性全连接层进行处理,再使用可变形卷积DeformableConvolution,DConv和SiLU激活函数处理特征图;通过二维选择模块SS2D提取长距离空间依赖信息;使用归一化层处理特征图,生成Xt′,整个过程可以计算如下: ; ; 所述可变形卷积DConv,将输入特征图动态生成卷积核偏移量,对特征图进行不规则采样,实现自适应特征提取;根据输入特征图计算偏移场,其是与输入特征图空间尺寸相同的张量,是每个像素点在空间上的邻居数量,每个位置的偏移量指导后续特征采样;对输入特征图进行不规则采样,根据其对应偏移量,在输入特征图中找到相邻像素进行采样,并通过插值等方法计算该位置的特征值;经过偏移采样后的特征通过聚合操作进行特征融合,得到输出特征图; 在分支Xb中,特征X首先通过一个线性全连接层Linear,将图像转换到张量空间;使用SiLU激活函数处理全连接层输出的结果,得到特征图Xb′,这个过程可以计算如下: ; 在和上进行元素相乘操作,实现两条分支的特征融合;使用全连接层处理融合后的特征图,输出特征X’; 所述视觉状态空间模块VSSBlock中的SS2D模块用于特征信息捕捉,其结构包括:交叉扫描Cross-Scan、选择性扫描SelectiveScanningwithS6Blocks和交叉合并Cross-Merge;其中,交叉扫描Cross-Scan将输入图像划分为非重叠补丁,然后沿四个方向左上到右下、右下到左上、右上到左下、左下到右上展开为序列;选择性扫描SelectiveScanningwithS6Blocks:每个方向的序列由独立的块处理,提取特征并保留相关信息,过滤无关信息;交叉合并Cross-Merge:将处理后的序列重新组合,恢复为二维特征图,整合多方向上下文信息,实现全局感受野;输入图像沿着不同方向的四条路径遍历,并展开成序列形式,这4条路径的方向分别为:从左上方到右下方、从右下方到左上方、从右上方到左下方、从左下方到右上方;并行处理每个方向得到的序列进行特征提取;对从四个不同方向获得的特征序列进行展开、汇总、合并,得到与输入特征图大小一致的特征图; 步骤1.2,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络的下采样2模块; 所述下采样2模块包括第一卷积层、视觉状态空间模块VSSBlock和最大池化层;其中,第一卷积层用于调整图像维度,便于后续计算;VSSBlock提取多层次空间与语义特征;最大池化层通过缩小特征图尺寸,减少后续层的参数和计算量,加速训练; 步骤1.3,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络的下采样3模块; 所述下采样3模块包括第一卷积层、视觉状态空间模块VSSBlock和最大池化层;其中,第一卷积层用于调整图像维度,便于后续计算;VSSBlock提取多层次空间与语义特征;最大池化层通过缩小特征图尺寸,减少后续层的参数和计算量,加速训练; 步骤1.4,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络的下采样4模块; 所述下采样4模块包括第一卷积层、频域增强模块FreqEM和最大池化层;其中,第一卷积层用于调整图像维度,便于后续计算;FreqEM用于提升频域特征表达能力,提取滑坡地质灾害的深层语义特征;最大池化层通过缩小特征图尺寸,减少后续层的参数和计算量,加速训练; 所述FreqEM模块结构具体过程为:将下采样3模块输出的特征图X执行线性全连接层,得到归一化后的特征Xln,公式表示为: ; 将Xln输入到视觉状态空间模块VSSBlock,VSSBlock提取多层次空间与语义特征,得到新的特征表示Xssd;将Xssd与原始输入特征X相加,实现特征融合,具体公式为: ; 将Xadd执行线性全连接操作,稳定特征分布,生成Xln2,公式表示为: ; 将线性全连接后的特征图Xln2输入到可变形卷积DConv模块,得到增强后的特征图Xdconv;将Xdconv与Xadd相加,得到深层特征增强后的特征图Xout,公式表示为: ; 步骤1.5,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的编码子网络的下采样5模块; 所述下采样5模块包括第一卷积层、频域增强模块FreqEM和最大池化层;其中,第一卷积层用于调整图像维度,便于后续计算;FreqEM用于提升频域特征表达能力,提取滑坡地质灾害的深层语义特征;最大池化层通过缩小特征图尺寸,减少后续层的参数和计算量,加速训练; 构建基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络,并恢复特征图到原始特征图大小,包括: 搭建基于视觉状态空间和频域增强的遥感影像滑坡识别方法解码子网络,其结构依次为:上采样1、上采样2、上采样3、上采样4和上采样5; 步骤2.1,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络的上采样1模块; 所述上采样1模块,其结构包括GSUBlock和第二卷积;GSUBlock用于增强下采样5模块提取的滑坡地质灾害的语义特征,通过双路径卷积分别提取局部与全局上下文特征,并恢复特征图的大小; 所述GSUBlock模块,是把输入特征图,第一条路径采用3×3分组空间卷积GroupedSpatialConvolution,GSConv核提取局部上下文特征: ; 第二条路径使用1×1GSConv捕获全局特征关联: ; 其中,W3和W1分别为卷积核权重参数,两分支输出经批量归一化与ReLU6激活函数处理: ; ; 将两条路径的输出特征图相加,得到融合后的多尺度特征Ff: ; 将多尺度特征图Ff输入到挤压激励注意力模块SE,通过全局平均池化与全连接层生成通道权重,对特征图进行加权: ; ; ; 其中,为降维升维矩阵,r为压缩比,加权后的特征表示为: ; 为防止过拟合,使用Dropout层删除部分冗余特征: ; 所述分组空间卷积GSConv,是将输入特征图分成若干组,每组分别进行卷积操作,减少计算量的同时进行空间卷积,实现跨组特征的融合; 输入具有C个通道的特征图,第一个卷积单元为分组卷积层,其输入是输入的特征图,输出通道数为C2;第二卷积单元是逐点卷积层,其输入也是输入的特征图,输出通道数为C2;沿通道维度拼接第一卷积单元与第二卷积单元的输出,以形成具有C个通道的拼接特征图;用于对所述拼接特征图执行通道混洗操作,以生成输出特征图; 步骤2.2,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络的上采样2模块; 所述上采样2模块,其结构包括跳跃链接模块、GSUBlock和第二卷积;GSUBlock用于增强上采样1模块的滑坡地质灾害的语义特征,通过双路径卷积分别提取局部与全局上下文特征,并恢复特征图的大小;跳跃链接模块用于将上采样1模块输出的特征图和下采样4模块输出的特征图相加,得到融合后的特征图;第二卷积用于恢复特征图的大小,便于后续上采样; 步骤2.3,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络的上采样3模块; 所述上采样3模块,其结构包括跳跃链接模块、GSUBlock和第二卷积;GSUBlock用于增强上采样2模块的滑坡地质灾害的语义特征,通过双路径卷积分别提取局部与全局上下文特征,并恢复特征图的大小;跳跃链接模块用于将上采样2模块输出的特征图和下采样3模块输出的特征图相加,得到融合后的特征图;第二卷积用于恢复特征图的大小,便于后续上采样; 步骤2.4,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络的上采样4模块; 所述上采样4模块,其结构包括跳跃链接模块、GSUBlock和第二卷积;GSUBlock用于增强上采样3模块的滑坡地质灾害的语义特征,通过双路径卷积分别提取局部与全局上下文特征,并恢复特征图的大小;跳跃链接模块用于将上采样3模块输出的特征图和下采样2模块输出的特征图相加,得到融合后的特征图;第二卷积用于恢复特征图的大小,便于后续上采样; 步骤2.5,基于视觉状态空间和频域增强的遥感影像滑坡识别方法的解码子网络的上采样5模块; 所述上采样5模块,其结构包括GSUBlock和跳跃链接模块;GSUBlock用于增强上采样2模块的滑坡地质灾害的语义特征,通过双路径卷积分别提取局部与全局上下文特征,并恢复特征图的大小;跳跃链接模块用于将上采样2模块输出的特征图和下采样1模块输出的特征图相加,得到融合后的特征图; 构建基于视觉状态空间和频域增强的遥感影像滑坡识别方法的识别子网络,恢复遥感影像上滑坡的特征图到原始输入图像大小,包括: 步骤3,基于步骤1构建的编码子网络和步骤2构建的解码子网络,构建基于视觉状态空间和频域增强的遥感影像滑坡识别方法的识别子网络,包括: 识别子网络由一个卷积层组成,用于将解码子网络特征图恢复到原始的遥感影像大小; 构建基于视觉状态空间和频域增强的遥感影像滑坡识别网络,包括: 步骤4,基于步骤1构建的编码子网络、步骤2构建的解码子网络和步骤3构建的识别子网络,构建基于视觉状态空间和频域增强的遥感影像滑坡识别网络; 步骤4.1,将步骤1编码器提取的滑坡地质灾害范围的特征图和步骤2解码器提取的特征图通过上采样相加融合级联; 步骤4.2,将步骤2上采样块提取的滑坡地质灾害特征图和步骤3构建的识别子网络进行串联; 利用公开的滑坡识别数据集,生成训练集、验证集和测试集; 结合Dice损失函数训练所述基于视觉状态空间和频域增强的遥感影像滑坡识别网络,得到模型权重文件; 利用训练得到的模型权重文件,检测遥感影像上滑坡的范围。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院地球环境研究所,其通讯地址为:710061 陕西省西安市雁塔区中国科学院地球环境研究所;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励