Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学丁刚毅获国家专利权

北京理工大学丁刚毅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利基于搜索引擎与人类指导的多模态零样本缺陷检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119313651B

龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411484635.3,技术领域涉及:G06T7/00;该发明授权基于搜索引擎与人类指导的多模态零样本缺陷检测方法是由丁刚毅;白皓月;安宇设计研发完成,并于2024-10-23向国家知识产权局提交的专利申请。

基于搜索引擎与人类指导的多模态零样本缺陷检测方法在说明书摘要公布了:本发明提供一种基于搜索引擎与人类指导的多模态零样本缺陷检测方法,通过基于关键词的搜索引擎自动获取外源背景图像,极大简化了背景图像的获取流程;同时,本发明通过引入纹理元网络增强文本特征提取器,使其能够结合外源图像中的纹理信息,在处理未见材质或未见缺陷类别时,实现对缺陷的精确分割,克服了现有技术在面对罕见缺陷时的局限性;也就是说,本发明通过引入多模态零样本学习方法,结合文本和外源纹理图像的特征对齐,解决了传统缺陷检测算法对大规模数据集的依赖问题。

本发明授权基于搜索引擎与人类指导的多模态零样本缺陷检测方法在权利要求书中公布了:1.一种基于搜索引擎与人类指导的多模态零样本缺陷检测方法,其特征在于,采用缺陷检测大模型对查询图像进行缺陷检测,其中,所述缺陷检测大模型包括图像特征提取器、提示微调器、文本特征提取器、多头注意力机制,且大模型的训练方法包括以下步骤: 向关键词驱动的搜索引擎输入与查询图像相关的材质关键词,获取与查询图像最相似的材质图像作为外源纹理图像; 将查询图像和外源纹理图像分别输入图像特征提取器,对应得到查询图像特征和外源纹理图像特征; 将文本指导内容中的前景文本和背景文本分别与外源纹理图像特征组合输入提示微调器,对应得到融合了外源纹理图像特征的前景融合文本和背景融合文本;其中,前景文本包含待提取的缺陷类别信息; 将前景融合文本和背景融合文本分别输入文本特征提取器,得到初级前景文本特征和初级背景文本特征; 采用多头自注意力机制对初级背景文本特征和初级前景文本特征进行特征增强,得到最终的背景文本特征和前景文本特征; 将前景文本特征与查询图像特征相乘的结果作为前景特征; 将外源纹理图像特征对第一维度进行平均后的结果作为背景特征; 将前景特征和背景特征按照通道维度进行拼接,得到包含视觉信息和文本信息的多模态特征; 对多模态特征执行特征值比较操作,得到仅包含0和1两个数值的预测掩膜,其中,0表示背景,1表示缺陷,在多模态特征中不同通道的相同位置上的背景特征值大于前景特征值时,预测掩膜的对应位置上为0,否则,预测掩膜的对应位置上为1; 获取背景文本特征和背景特征之间的余弦相似度作为损失函数,并根据损失函数的梯度方向对检测大模型进行反向传播,以此改变图像特征提取器、提示微调器、文本特征提取器、多头注意力机制的网络参数,直到达到设定的训练迭代次数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。