华侨大学;厦门狄耐克智能科技股份有限公司杜吉祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华侨大学;厦门狄耐克智能科技股份有限公司申请的专利一种可解释性细粒度图像识别方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119625436B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510147874.8,技术领域涉及:G06V10/764;该发明授权一种可解释性细粒度图像识别方法、装置、设备及介质是由杜吉祥;官文娟;缪国栋;彭俊仁;张洪博;翟传敏设计研发完成,并于2025-02-11向国家知识产权局提交的专利申请。
本一种可解释性细粒度图像识别方法、装置、设备及介质在说明书摘要公布了:本发明提供了一种可解释性细粒度图像识别方法、装置、设备及介质,涉及细粒度图像识别技术领域,本方法采用双分支结构框架,结合特征融合和原型学习进行细粒度图像分类。其中,特征提取层通过自注意力机制捕获图像中的复杂模式和长距离依赖,同时引入特征选择融合模块,有效选择原型学习的信息标记,确保学习到的原型更注重前景。原型学习层设计了双分支结构,分别处理和学习图像的全局原型和局部原型,提高网络的准确率,并从全局的角度解释模型分类结果。全连接层实现最终的分类决策,通过加权和得到最终分类概率。旨在解决现有深度学习模型在细粒度图像分类问题上的黑盒特性,提高模型在高风险领域的应用可信度。
本发明授权一种可解释性细粒度图像识别方法、装置、设备及介质在权利要求书中公布了:1.一种可解释性细粒度图像识别方法,其特征在于,包括: 获取待识别的图像x,将所述图像x输入至特征提取层中进行特征提取预处理,生成输出向量; 将输出向量的类别编码向量作为全局特征,输入至原型学习层的全局分支中进行计算,得到全局特征与全局原型的相似度分数; 获取N个所述特征提取层输出的局部特征,并选取K个预设的前景信息相关特征进行局部原型学习,得到局部特征与局部原型的相似度分数; 使用全连接层对所述全局特征与全局原型的相似度分数和所述局部特征与局部原型的相似度分数进行概率计算处理,得到最终的分类概率,并基于所述分类概率,生成图像识别结果; 获取待识别的图像x,将所述图像x输入至特征提取层中进行特征提取预处理,生成输出向量,具体为: 获取待识别的图像x,,其中,图像x的大小为,H为图像高度,W为图像宽度,C为图像通道数,为矩阵; 将图片x切分成N个大小一致的补丁,并将补丁平铺成长度为的序列图像,,其中,补丁的大小为,是每个图像块的分辨率,为最终生成的块数; 对所述序列图像进行线性投影处理,生成一个特征序列; 在所述特征序列中添加类别编码向量,作为图像x的编码特征; 添加一个位置编码向量,将图像x的二维位置信息连接至一维的所述特征序列中,得到视觉向量,,其中,为第1个图像序列,为第2个图像序列,为第N个图像序列,E为单位矩阵,为第1个图像序列与单位矩阵的乘积,为第2个图像序列与单位矩阵的乘积,为第N个图像序列与单位矩阵的乘积; 将视觉向量输入至堆叠L个Transformer编码器的模块中,得到第l层Transformer编码器的输出向量,,,其中,每一Transformer编码器都包括一个多个自注意力头和多层感知机,LN表示归一化操作,MSA表示多头自注意力,MLP表示多层感知机,为第l-1层Transformer编码器的输出向量; 将输出向量的类别编码向量作为全局特征,输入至全局分支,将输出向量的融合特征作为局部特征,输入至局部分支。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华侨大学;厦门狄耐克智能科技股份有限公司,其通讯地址为:362000 福建省泉州市丰泽区城华北路269号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。