南京航空航天大学冯爱民获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京航空航天大学申请的专利一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121121767B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511658275.9,技术领域涉及:G06V30/18;该发明授权一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统是由冯爱民;郑骏杰设计研发完成,并于2025-11-13向国家知识产权局提交的专利申请。
本一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统在说明书摘要公布了:本发明公开了一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统,涉及计算机视觉领域,方法包括:从输入图像提取全局与局部视觉特征;视觉编码过程通过空间感知注意力增强模块校正深层网络中局部特征,针对异常视觉特征生成细粒度属性文本描述;通过属性感知引导模块将属性文本描述与通用文本提示进行深度语义对齐;计算增强的视觉特征和优化的文本特征相似度,生成像素级异常分割图;推理阶段将分割图通过异常感知重建模块转化为空间注意力权重,反馈至视觉编码器生成最终全局特征表示并计算异常分数。本发明方法在无需目标域训练样本条件下,显著提升了模型在工业缺陷检测等场景下的异常检测与定位准确性及泛化能力。
本发明授权一种基于三重感知学习增强视觉语言模型的零样本异常检测方法及系统在权利要求书中公布了:1.一种基于三重感知学习增强视觉语言模型的零样本异常检测方法,其特征在于,包括如下步骤: S1、将待处理样本图像进行预处理,包括尺寸归一化与数据标准化,并通过视觉语言模型的视觉编码器,提取表征全局语义的图像级全局特征,以及表征局部细节的多层次局部特征; S2、设定可学习的通用正常与异常文本提示,利用大型语言模型针对不同异常视觉特征生成细粒度属性文本描述; S3、在步骤S1视觉编码器深层网络中引入空间感知注意力增强模块,生成增强的多层次局部视觉特征,步骤包括: S3.1、将视觉编码器深层网络的传统Query‑Key注意力机制替换为Value‑Value自相关注意力机制; S3.2、利用独立的视觉基础模型提取输入图像的局部特征,并计算其自相似度矩阵; S3.3、对所述自相似度矩阵进行阈值化处理,将相似度低于预设阈值的区域关联性抑制为负无穷,生成掩码矩阵,用以增强正向关联并抑制弱相关区域; S3.4、将所述掩码矩阵与Value‑Value自相关注意力进行融合,生成空间一致性增强后的局部特征,注入回视觉编码器的最后k个层中,动态引导模型的注意力; S4、将步骤S2中生成的属性文本描述与通用文本提示输入属性感知引导模块,通过属性引导的提示学习进行语义对齐,并通过属性引导的图像聚合,生成与特定异常属性关联的视觉表征;利用语义相似的非正确异常属性描述作为负样本进行训练,得到优化的文本特征; S5、将步骤S3中生成的多层次局部视觉特征,以及步骤S4中生成的与特定异常属性关联的视觉表征,共同与S4中经过语义对齐优化的文本特征进行相似度计算,生成像素级异常分割图作为异常定位图;同时将步骤S1中的图像级全局特征与通用文本提示进行相似度计算,生成全局特征得分; S6、将步骤S5得到的像素级异常分割图输入异常感知重建模块,转化为空间注意力权重,动态引导模型关注潜在异常区域,生成最终视觉特征表示; 所述异常感知重建模块在推理阶段被激活,将像素级异常分割图转化为空间注意力权重,具体方法如下: S6.1、对步骤S5中生成的像素级异常分割图进行阈值抑制,保留显著异常区域并滤除背景噪声; S6.2、将经过阈值抑制处理后的分割图进行尺寸重塑,并应用高斯平滑处理,生成标准化的空间注意力权重图; S6.3、将生成的空间注意力权重图与所述视觉编码器最终层的原始注意力计算过程进行加权融合,将注意力动态引向潜在的异常区域,生成对局部异常敏感的最终视觉特征表示; S7、基于步骤S6中生成的最终视觉特征与S4中优化的文本特征计算最终相似度,并结合S5中的全局特征得分、异常分割图最大值得到最终的图像级异常分数,并以此作为图像是否异常的分类判别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京航空航天大学,其通讯地址为:210016 江苏省南京市秦淮区御道街29号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励