长春理工大学才华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长春理工大学申请的专利基于2D邻域聚合和曼哈顿距离的图像语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119206210B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411198433.2,技术领域涉及:G06V10/26;该发明授权基于2D邻域聚合和曼哈顿距离的图像语义分割方法是由才华;刘子玥;付强;寇婷婷;马智勇;王伟刚设计研发完成,并于2024-08-29向国家知识产权局提交的专利申请。
本基于2D邻域聚合和曼哈顿距离的图像语义分割方法在说明书摘要公布了:本发明公开了一种基于2D邻域聚合和曼哈顿距离的图像语义分割方法,属于图像分割和深度学习领域,所述方法由图像语义分割系统执行,图像语义分割系统包括MiT编码器和轻量级MLP解码器,MiT编码器包括重叠补丁嵌入模块和TransformerBlock模块,在Transformer网络框架下,2D邻域聚合模块即通过曼哈顿距离计算相邻令牌的相似性分数,并基于这些分数进行合并,令牌合并能够与任何训练过的Transformer一起使用,无需重新训练模型,能显著减少注意力机制的计算负担,保持高性能值的同时实现显著的加速。
本发明授权基于2D邻域聚合和曼哈顿距离的图像语义分割方法在权利要求书中公布了:1.基于2D邻域聚合和曼哈顿距离的图像语义分割方法,其特征在于,该方法由图像语义分割系统执行,图像语义分割系统包括MiT编码器和轻量级MLP解码器,MiT编码器包括重叠补丁嵌入模块和TransformerBlock模块,重叠补丁嵌入模块用于从整幅图像中提取出补丁图像,并将所有补丁展平并嵌入成一个高维向量,TransformerBlock模块数量为四个,四个TransformerBlock模块依次连接,且上一个TransformerBlock模块的输出作为下一个TransformerBlock模块的输入,同时所有TransformerBlock模块的输出均传送至轻量级MLP解码器; 具体包括如下步骤: 步骤S1:将原始图像输入到MiT编码器中,重叠补丁嵌入模块提取大小为7*7像素的补丁,每个补丁不仅包括本身的7*7像素区域,还包含与相邻补丁的重叠部分,将所有7*7像素的补丁展平并嵌入成一个高维向量送入到TransformerBlock模块中; 步骤S2:MiT编码器采用金字塔结构跨四个阶段计算多尺度特征,每个阶段生成一个维度为的特征图,其中,、和分别是原始图像的高度、原始图像的宽度和每个阶段之后的通道数; 步骤S3:将步骤S2获得的四张特征图经过轻量级MLP解码器进行线性变换,使它们的维度统一,然后进行上采样,将它们合并为一个特征图,通过MLP层转换为最终的预测结果,最终的预测结果是图像的像素级的分割掩码; 其中,数据进入TransformerBlock模块后,在计算多头注意力之前,对键向量K和值向量V通过带有步长为R的2D卷积实现空间衰减注意力,然后通过2D合并模块,即一个步长为2的2D最大池化层和池化内核来减少令牌数量,同时,对查询向量Q进行2D邻域聚合即通过曼哈顿距离计算相似性,并根据预先设置相似度阈值,将相似度高于相似度阈值的令牌进行合并,通过设置约简率r即合并令牌的百分比来控制令牌数量;然后进行多头自注意力机制计算,生成加权后的特征向量;在多头注意力之后取消令牌合并,输出结果传递给下一个TransformerBlock模块。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春理工大学,其通讯地址为:130022 吉林省长春市卫星路7089号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励