杭州电子科技大学徐咏淇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利基于属性级最优传输对齐的图像分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121353816B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511939090.5,技术领域涉及:G06V10/764;该发明授权基于属性级最优传输对齐的图像分类方法及系统是由徐咏淇;张旻;姜明设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本基于属性级最优传输对齐的图像分类方法及系统在说明书摘要公布了:本发明公开了基于属性级最优传输对齐的图像分类方法及系统,该方法首先将输入图像划分为图像块,附加类标记向量,通过编码器形成类标记向量和视觉特征向量。其次基于类标记向量,提取视觉属性特征,并构造提示语句,经过文本编码器得到文本属性特征。然后基于视觉属性特征与文本属性特征构建属性级代价矩阵,计算得到视觉属性和文本属性之间的属性级相似度;根据文本属性特征,计算得到属性级预测概率,并应用自注意力机制,得到全局特征预测概率。最后对属性级预测概率与全局特征预测概率进行加权融合,得到最终类别预测概率。本发明实现对图像语义与属性特征的协同学习,使图像分类具有更高的准确性与可解释性。
本发明授权基于属性级最优传输对齐的图像分类方法及系统在权利要求书中公布了:1.基于属性级最优传输对齐的图像分类方法,其特征在于,包括以下步骤: 步骤一:将输入图像划分为若干大小固定的图像块,形成图像块嵌入序列,并附加类标记向量,通过Transformer编码器,形成类标记向量和视觉特征向量; 步骤二:基于类标记向量,通过属性提取网络,提取视觉属性特征,实现过程为:将类标记向量和图像块嵌入序列拼接形成图像特征,将该图像特征输入至属性提取网络中进行映射,得到视觉属性特征; 步骤三:先基于预设模板构造提示语句,生成对应类别的对于典型属性的视觉描述文本,经过文本编码器得到文本属性特征,具体实现过程为:使用特征模板构造针对每个数据集的提示语句,用于引导大语言模型生成与图像分类相关的特征信息,得到一组特征信息,针对每个类别,针对特征信息,使用文本模板得到文本属性集合,每个类别有条自然语言描述句子;将该文本属性集合输入至文本编码器,得到文本属性特征; 步骤四:基于视觉属性特征与文本属性特征构建属性级代价矩阵,计算得到视觉属性和文本属性之间的属性级相似度,具体实现过程如下: 获取步骤二得到的原始图像的视觉属性特征,和步骤三得到的原始图像对应类别的文本属性特征,其中表示该类别的第条属性描述的嵌入向量,两者计算最优传输矩阵,利用Sinkhorn算法进行属性级对齐:首先构建属性级代价矩阵,在不同模态的属性特征之间建立对应关系,计算两者在嵌入空间的相似性,通过嵌入空间的相似性取反获取属性级代价矩阵中对应的元素; 采用离散OT表达得到视觉属性特征和文本属性特征离散概率分布,图像属性分布和文本属性分布,表示属性点的质量分布,然后最小化属性对之间的加权代价为目标,计算最优传输矩阵,同时加入约束条件保证传输质量守恒; 求解最优传输矩阵是一个线性规划问题,引入熵正则化项,使得每个视觉属性和多个文本属性之间都有匹配概率; 采用迭代算法Sinkhorn对引入熵正则化项后的最优传输矩阵进行求解,用Sinkhorn得到控制行方向的分布和控制列方向的分布,通过交替缩放行列收敛得到最终的最优传输矩阵; 最后通过最优传输矩阵对视觉属性特征和文本属性特征的相似性进行加权,计算得到视觉属性特征和文本属性特征之间的属性级相似度,反映图像与文本在属性层面的对齐程度; 步骤五:根据文本属性特征,计算属性级相似度,得到属性级预测概率;将视觉属性特征与文本属性特征分别应用自注意力机制,得到全局特征预测概率; 步骤六:对属性级预测概率与全局特征预测概率进行加权融合,得到最终类别预测概率,完成图像分类,并进行反向训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励