山西大学梁吉业获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山西大学申请的专利一种基于主动学习的开放集图像识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116681975B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310542527.6,技术领域涉及:G06V10/778;该发明授权一种基于主动学习的开放集图像识别方法及系统是由梁吉业;王慧敏;王智强;郭婷设计研发完成,并于2023-05-15向国家知识产权局提交的专利申请。
本一种基于主动学习的开放集图像识别方法及系统在说明书摘要公布了:本发明涉及机器学习开放集图像识别技术领域。现有方法对未标记数据的评估和伪标记信息的利用不足,难以学习到类别区分度较高的特征表示;本发明提供一种基于主动学习的开放集图像识别方法及系统,根据给定图像数据集使用Word2Vec生成已见类别的语义表示;训练特征提取模型,并将图像特征的匹配得分,与自适应选择的阈值进行比较,区分开放集样本和已见类样本;通过主动学习策略迭代地将高置信度已见类样本添加到标记数据集中,直到开放集样本都被识别出来;为每个未标记数据进行类别预测。本发明充分利用了未标记数据的伪标记信息,减少开放集样本对分类模型的影响并扩充标记数据集,提升了开放集图像识别的准确率。
本发明授权一种基于主动学习的开放集图像识别方法及系统在权利要求书中公布了:1.一种基于主动学习的开放集图像识别方法,其特征在于,该方法包括如下步骤: S1:给定标记图像数据集和未标记数据集,利用语言模型Word2Vec生成已见类图像对应的类别语义表示; S2:引入图像旋转预测框架RotNet,对给定图像数据集中的图像分别旋转、、和,进行自监督表示增强学习,训练图像特征提取模型,构造自监督损失; S3:利用图像特征提取模型对所有图像进行特征表示,融入类别语义知识,将图像特征和类别语义知识映射到公共空间进行相似度计算,利用余弦相似度,计算图像特征和类别语义匹配得分,构造匹配损失; 将图像特征和类别语义特征映射到公共空间实现视觉特征和语义特征的对齐,对于语义特征,利用Word2Vec得到已见类语义表示,对于图像和它的标签,首先提取图像的特征,接着抽取标签对应的语义表示,然后将和映射到一个公共空间进行相似度计算,利用余弦相似度,得到样本和标签的匹配得分: 通过计算图像和类别语义相似度的大小来反映是否是的正确类别标签,其中类别语义相似度大的被认为是正确的类别标签; 随机选择除真实标签和最难区分标签之外的标签,下面是模型训练的损失函数,标记数据的损失函数如下: 其中,和分别表示最难区分的标签和随机选择的标签, 对于每一个未标记数据,假设其预测概率为,其伪标签,未标记数据的损失函数如下: 其中,, 由此构造匹配损失: S4:通过Otsu算法自适应选择预定义的阈值,将匹配得分与预定义的阈值进行比较,匹配得分低于阈值的未标记图像认为是开放集图像,匹配得分高于阈值的未标记图像认为是已见类图像; S5:采用主动学习策略,选择高置信度开放集样本和高置信度已见类样本,得分最高的样本是高置信度样本,将高置信度已见类样本及其计算得到的伪标签添加到标记数据中进行训练,以此形成循环,直到开放集样本都被识别出来,同时实现标记数据集的扩充; S6:为每个未标记数据进行类别预测,构造分类损失。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励