北京工业大学刘博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京工业大学申请的专利一种基于Transformer架构的图像语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115482382B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211132360.8,技术领域涉及:G06V10/26;该发明授权一种基于Transformer架构的图像语义分割方法是由刘博;李金书;王慧娜设计研发完成,并于2022-09-17向国家知识产权局提交的专利申请。
本一种基于Transformer架构的图像语义分割方法在说明书摘要公布了:一种基于Transformer架构的图像语义分割方法属于医学图像分割技术领域。本发明提供一种带有移动窗口的分层SwinTransformer编码器来提取图像上下文特征的方法。首先图像块被输入到基于Transformer的编码器‑解码器架构中,其中移动窗口机制的设计使得特征包含信息更全面。而UNet++模型中嵌套和密集的跳跃连接能够充分提取上下文特征,使得特征融合更充分。
本发明授权一种基于Transformer架构的图像语义分割方法在权利要求书中公布了:1.一种基于Transformer架构的图像语义分割方法,其特征在于: 步骤1、预处理模块;将初始输入的图像缩放,调整后的图像尺寸记为W×H,其中W表示图像的宽,H表示图像的高,W×H描述图像的分辨率,即像素点的个数;接着对输入图像进行数据增强,以增加数据多样性;PatchPartition将图像的尺寸压缩;LinearEmbedding则利用线性嵌入层将投影的特征维转化为任意维C; 步骤2、Swin-UNet++模块;基于SwinTransformer块对步骤1输出的特征图进行学习;使用patch合并层和SwinTransformer块完成下采样,使用patch扩展层和SwinTransformer块完成上采样;下采样过程中,通过多个SwinTransformer块和patch合并层,生成分层特征表示;上采样过程则包括多个SwinTransformer块和patch扩展层;通过跳跃连接将提取的上下文特征与编码器的多尺度特征融合,以弥补下采样造成的空间信息损失; 步骤3、恢复模块进行图像的像素级预测 恢复模块的结构依次为:Swin-UNet++模块输出的特征图→patch扩展层→LinearProjection层→输出图像像素级预测结果 步骤3.1利用最后一层patch扩展层对特征图进行上采样,将Swin-UNet++模块输出的特征图的分辨率恢复到输入分辨率W×H;这一patch扩展层首先通过一个全连接层扩展通道数,此处设置输出张量的维度为输入的16倍,并利用rearrangeoperation将相邻维度的特征图重组成更大的特征图,再进行LayerNorm通道归一化处理,实现上采样; 步骤3.2对这些上采样的特征进行线性投影,输出像素级的分割预测结果W×H×Class,其中Class为像素级分类的类别数,H表示图像的高,W表示图像的宽; 自此,完成将图像输入到定义好的Swin-UNet++网络并得到像素级的预测结果,根据真实标签与预测结果计算DSC即Dice相似系数;记录在分割图像各个子类的DSC参数和分割图像整体的DSC参数,以评估分割的准确率;其中DSC即Dice相似系数用于度量两个集合的相似度,取值范围为[0,1],值越大,表示两个集合越相似。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励