Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 之江实验室;华中科技大学李特获国家专利权

之江实验室;华中科技大学李特获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉之江实验室;华中科技大学申请的专利基于朴素VisionTransformer的弱监督语义分割方法与装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116071553B

龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310160328.9,技术领域涉及:G06V10/26;该发明授权基于朴素VisionTransformer的弱监督语义分割方法与装置是由李特;顾建军;朱良辉;李应悦;王兴刚设计研发完成,并于2023-02-16向国家知识产权局提交的专利申请。

基于朴素VisionTransformer的弱监督语义分割方法与装置在说明书摘要公布了:本发明公开了一种基于朴素VisionTransformer的弱监督语义分割方法,包括:将基于输入图像得到的补丁标记和可学习的类标记输入到transformer编码器中得到特征输出;然后基于输出的补丁标记部分通过重排列和卷积操作得到粗糙CAM,并从编码器的模型参数中提取出自注意力图;接着通过自适应注意力图融合模块对自注意力图进行融合,得到交叉注意力图和补丁自注意力图依次对粗糙CAM进行优化得到最终的细CAM;最后分别基于编码器输出的类标记、粗CAM以及细CAM通过全局池化得到类别预测,与类别标记计算交叉熵损失函数来对网络进行优化;基于梯度截断解码器的在线再训练。本发明还提供了相应的基于朴素VisionTransformer的弱监督语义分割装置。

本发明授权基于朴素VisionTransformer的弱监督语义分割方法与装置在权利要求书中公布了:1.一种基于朴素VisionTransformer的弱监督语义分割方法,其特征在于,包括如下步骤: (1)用来生成CAM的分类网络框架使用朴素ViT作为主干网络,将基于输入图像得到的补丁标记和可学习的类标记输入到transformer编码器中得到特征输出;然后基于输出的补丁标记部分通过重排列和卷积操作得到粗糙CAM,并从编码器的模型参数中提取出自注意力图;接着通过自适应注意力图融合模块对自注意力图进行融合,得到交叉注意力图和补丁自注意力图依次对粗糙CAM进行优化得到最终的细CAM;最后分别基于编码器输出的类标记、粗CAM以及细CAM通过全局池化得到类别预测,与类别标记计算交叉熵损失函数来对网络进行优化;其中,提取自注意力图具体包括:基于编码器的输出来生成类激活图CAM,编码器的输出分为类标记部分以及补丁标记部分,用补丁标记部分来生成CAM;首先对补丁部分进行重排列并通过一个卷积层得到初始的粗糙类激活图;然后从编码器的模型参数中提取出自注意力图来优化,其中为每个编码层注意力头的数量;考虑类标记和补丁标记,自注意力图分为交叉注意力图和补丁注意力图; (2)基于梯度截断解码器的在线再训练,其中transformer编码器的实施方式与上一步中相同,而为了对CAM种子中的噪声进行处理,在transformer解码器中加入了梯度裁剪的部分,来截断在反向传播时噪声的梯度回传,利用再训练后得到的模型实现对图像的语义分割。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室;华中科技大学,其通讯地址为:311121 浙江省杭州市余杭区中泰街道之江实验室新园区一期西区主楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。