Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北大学张云洲获国家专利权

东北大学张云洲获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北大学申请的专利一种基于文本指导的零样本表面缺陷分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785026B

龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411837558.5,技术领域涉及:G06V10/26;该发明授权一种基于文本指导的零样本表面缺陷分割方法是由张云洲;金雨昕;单德兴;吴支飞设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。

一种基于文本指导的零样本表面缺陷分割方法在说明书摘要公布了:本发明属于表面缺陷检测技术领域,公开一种基于文本指导的零样本表面缺陷分割方法。引入人类提供的文本信息作为辅助信息,从而实现更准确的零样本表面缺陷分割;通过基于注意力的多级特征融合模块融合多层次图像特征,形成更全面的特征表示;通过多模态特征自适应平衡模块融合对齐文本与图像特征,提高模型的泛化能力;基于对齐的特征获得先验的图像‑文本相关性图,用以指导解码器进行解码,在缺少标记样本的条件下,实现了目标缺陷的像素级分割。本发明在零样本条件下能够有效分割表面缺陷,比现有基准更接近真值标签。

本发明授权一种基于文本指导的零样本表面缺陷分割方法在权利要求书中公布了:1.一种基于文本指导的零样本表面缺陷分割方法,其特征在于, 通过人类提供的目标缺陷类别与背景信息,根据文本模板得到文本提示;通过视觉语言模型CLIP的文本编码器和图像编码器分别提取文本嵌入和图像特征; 基于注意力的多级特征融合模块融合图像编码器获得的图像特征,得到多级融合特征; 将所述图像特征和文本嵌入输入到多模态特征自适应平衡模块,根据自注意力分别提取图像特征表示与文本特征表示,利用交叉注意力计算文本特征表示与图像特征表示之间的相互作用,从而促进不同模态间的对齐和融合; 基于文本特征表示和图像特征表示获得先验的图像-文本相关性图; 将多级融合特征和先验的图像-文本相关性图在通道维度上进行拼接,输入到解码器中解码得到目标缺陷的像素级分割结果;所述文本模板为“aphotoofthe{class}defectonthe{background}”,并且{class}和{background}成对出现,替换为实际的缺陷类别与背景信息; 所述视觉语言模型CLIP的图像编码器为改进的ResNet50网络,对目标图像进行特征提取,对应得到图像特征,其中n是图像编码器中得到的第n层特征; 所述改进的ResNet50网络为基于原ResNet50网络的四层残差块最后一层添加注意力池化层;所述注意力池化层中,将图像编码器最后一层残差块对应的特征通过全局平均池化得到全局特征,进行拼接得到;通过多头注意力获得图像编码器最终输出的高级图像特征: ; 其中,表示多头注意力机制,表示增强的全局特征,表示语义兼容特征;所述基于注意力的多级特征融合模块包括自注意力机制和交叉注意力机制;将图像编码器第三层残差块对应的中级特征通过上采样处理得到,与图像编码器第二层残差块对应的中级特征尺寸相同,融合和: ; 其中,表示拼接;调整融合特征尺寸得到二维融合特征,其中,、表示特征的通道数,表示,和表示特征的尺寸; 通过自注意力机制增强融合特征,通过计算输入的融合特征自身每个位置与其他位置的相似性生成权重矩阵,并将所有位置的值向量按权重进行加权求和: ; 其中,表示向量维度,用以避免值过大,表示自注意力机制,表示归一化函数,、与由利用线性变化计算获得; 将自注意力增强后的特征与二维融合特征通过残差连接,得到增强的中级特征: ; 通过交叉注意力机制融合高级图像特征和增强的中级特征,得到融合特征,将其与增强的中级特征进行残差连接,并调整特征尺寸得到多级融合特征: ; ; 其中,由增强的中级特征映射得到,而与由高级图像特征映射得到;所述多模态特征自适应平衡模块为包括文本分支和图像分支的双分支网络;所述文本分支接收文本嵌入,所述图像分支接收图像特征,二者分别利用自注意力机制对文本嵌入和图像特征进行特征增强;利用交叉注意力机制建立文本嵌入和图像特征之间的相互作用,对齐文本和图像模态,同时根据可学习参数实现多模态特征自适应融合对齐; 所述特征增强过程为,将获得的图像特征和文本嵌入分别基于自注意力进行增强,将得到的增强特征作为残差项和原本的特征进行连接,得到增强的文本嵌入和增强的图像特征: ; ; 其中,,每一组、与分别由输入的文本嵌入和图像特征利用线性变化计算获得; 所述文本嵌入和图像特征之间的相互作用获取过程如下: 文本分支中,利用交叉注意力计算与增强的文本嵌入对应的增强图像特征区域,对齐语义信息与视觉特征,得到文本相关性特征: ; 其中,表示交叉注意力机制,增强的文本嵌入利用线性变化计算获得,增强的图像特征用线性变化计算获得和; 图像分支中,利用交叉注意力计算增强图像特征对应的增强文本嵌入区域,建立更强的语义连接,得到图像相关性特征: ; 其中,表示交叉注意力机制,与式9中的结构相同,增强的图像特征利用线性变化计算获得,增强的文本嵌入用线性变化计算获得和; 所述自适应融合对齐实现过程为,将文本相关性特征和图像相关性特征作为残差项,在文本分支、图像分支中分别引入可学习参数、,其中表示的通道数、的通道数,用以自适应地调整残差项贡献,得到文本对齐特征和图像对齐特征: ; ; 其中,由对齐的全局特征和对齐的语义兼容特征拼接得到。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。