Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学杨育彬获国家专利权

南京大学杨育彬获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学申请的专利一种基于视觉Transformer和原型学习的可解释图像识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119295818B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411361935.2,技术领域涉及:G06V10/764;该发明授权一种基于视觉Transformer和原型学习的可解释图像识别方法是由杨育彬;庾安妮设计研发完成,并于2024-09-27向国家知识产权局提交的专利申请。

一种基于视觉Transformer和原型学习的可解释图像识别方法在说明书摘要公布了:本发明公开了一种基于视觉Transformer和原型学习的可解释图像识别方法,包括以下步骤:进行图像预处理,将训练数据中的待识别图像归一化并划分为多个非重叠的图像补丁,然后将每个图像补丁展平为一维向量;使用不同类型的视觉Transformer编码器提取所述图像补丁的长程依赖特征表示;设计原型分支并组成双分支原型层和单分支原型层;根据视觉Transformer编码器的类型,通过双分支原型层或单分支原型层,计算相似度并转化得到激活图,并处理所述激活图;构建线性分类器得到图像识别结果;对所述图像识别结果的获取过程进行解释,完成基于视觉Transformer和原型学习的可解释图像识别。

本发明授权一种基于视觉Transformer和原型学习的可解释图像识别方法在权利要求书中公布了:1.一种基于视觉Transformer和原型学习的可解释图像识别方法,其特征在于,包括以下步骤: 步骤1,进行图像预处理,将训练数据中的待识别图像归一化并划分为多个非重叠的图像补丁,然后将每个图像补丁展平为一维向量; 步骤2,使用不同类型的视觉Transformer编码器提取所述图像补丁的长程依赖特征表示,所述长程依赖特征表示包含非局部特征表示或局部特征表示; 步骤3,设计原型分支并组成双分支原型层和单分支原型层,所述原型分支包括非局部原型分支和局部原型分支,每个原型分支将训练数据映射到一个度量空间,并定义一组代表所述非局部特征表示或局部特征表示的原型; 步骤4,在所述的度量空间中,根据步骤2中所述的视觉Transformer编码器的类型,通过双分支原型层或单分支原型层,依次计算步骤3中所述的非局部特征表示和局部特征表示与原型的相似度; 步骤5,由步骤4所述相似度转化得到激活图,利用类感知激活细化方法处理所述激活图,并使用扩散指数量化所述激活图中激活区域的分散程度; 步骤6,构建线性分类器,输入为非局部特征表示或局部特征表示与原型的相似度,输出为图像类别的概率分布;根据所述概率分别进行计算,得到所述待识别图像的预测类别,即图像识别结果; 步骤7,根据步骤5所述的类感知激活细化方法将原型映射到原始图像空间,生成可视化表示,并结合步骤6所述的线性分类器的输入和权重,对所述图像识别结果的获取过程进行解释,完成基于视觉Transformer和原型学习的可解释图像识别; 其中,步骤5中所述的利用类感知激活细化方法处理所述激活图,并使用扩散指数量化所述激活图中激活区域的分散程度,具体包括: 步骤5-1,计算基尼系数G,用于度量所述激活图Sm中像素激活值的分散程度,具体如下: 其中,Si和Sj表示激活图Sm中第i个和第j个维度的绝对值,n表示激活图的大小,表示激活图Sm的平均值,基尼系数G的取值范围为[0,1],当G=0时,表示所有维度的像素激活值完全相同,当G=1时,表示仅有一个维度的像素激活值最强,而其他维度的像素未被激活; 步骤5-2,将基尼系数G转换为扩散指数DI,计算方法如下: DI=1-G×100 扩散指数DI的范围为[0,100],DI值越大则注意力的分散度越高;扩散指数DI用于优化所述视觉Transformer编码器的注意力分布; 步骤5-3:计算所述视觉Transformer编码器的第l个视觉Transformer块中的多头自注意力模块的注意力权重Al,方法如下: 其中,Ql和Kl是第l个视觉Transformer块的查询Query和键Key,维度为D,注意力头数量为H;计算所有注意力头的平均注意力向量并将其聚合为矩阵方法如下: 其中,L表示视觉Transformer块的数量; 将矩阵重塑为矩阵得到注意力图 步骤5-4,使用类感知激活细化,将注意力图与激活图Sm逐元素相乘,生成精细激活图S′,具体如下: 其中,⊙表示逐元素相乘; 步骤5-5,通过全局最大池化将每个原型的相似度分数规约为紧凑最大值具体如下:

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210008 江苏省南京市鼓楼区汉口路22号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。