北京理工大学唐永翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种使用分区决策机制提高图像分类准确率的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114743055B 。
龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210406278.3,技术领域涉及:G06V10/764;该发明授权一种使用分区决策机制提高图像分类准确率的方法是由唐永翔;金福生;袁野;王国仁;马波设计研发完成,并于2022-04-18向国家知识产权局提交的专利申请。
本一种使用分区决策机制提高图像分类准确率的方法在说明书摘要公布了:本发明公开了一种使用分区决策机制提高图像分类准确率的方法,基于集成学习思想,使用分区决策机制,让模型针对图像不同区域进行识别,将多个识别结果汇总,进而推断出整张图像所属类别,提供了一种能够稳定、可靠地提高图像分类准确率的模型改进方法,且模型训练流程简单,提高卷积神经网络模型进行图像分类时的准确率,同时不为训练带来过大的额外运算开销。
本发明授权一种使用分区决策机制提高图像分类准确率的方法在权利要求书中公布了:1.一种使用分区决策机制提高图像分类准确率的方法,其特征在于,包括以下步骤: 步骤1:采集针对目标应用场景的图像数据,并进行人工标注类别标签处理,构成原始图像数据集; 步骤2:对所述原始图像数据集中图像进行分区裁剪,生成子图数据集; 步骤3:构造数据集读取器,并对数据集读取器从所述子图数据集中分批选取出的若干子图像进行数据预处理,获得训练图像; 步骤31:对选取出的若干子图像按照预设尺寸进行缩放; 步骤32:对缩放后的子图像进行像素填充,并将填充后的图像随机裁剪为所述预设尺寸,获得重新裁剪图像; 步骤33:随机选取一半所述重新裁剪图像沿竖直中心轴左右翻转,将翻转后的图像和所述重新裁剪图像构成增广图像集; 步骤34:根据预设三通道均值和预设三通道方差对增广图像集中所有图像进行标准化,生成所述训练图像; 步骤4:构造卷积神经网络模型作为分类基础模型; 步骤5:将所述训练图像输入至所述分类基础模型进行训练,获得图像分类模型;在每批次训练中,使用步骤3中所得的数据集读取器,从步骤2中所得的子图数据集的训练集中选取若干子图,将经过处理后的训练图像输入步骤4中所得的模型进行训练,模型训练过程包括: 步骤51:将所述训练图像输入所述分类基础模型,依次经过不同网络层,获得当前模型输入的输出结果; 步骤52:根据所述输出结果和所述训练图像对应标注的类别标签,利用所述损失函数计算输出损失值; 步骤53:根据所述输出损失值进行反向传播,对所述分类基础模型进行梯度下降,进行模型参数更新; 步骤54:利用所述优化器对所述训练参数进行调整; 步骤55:所述数据集读取器选取图像是否结束,如果否,则选取下一批训练图像进行训练,并返回所述步骤51;如果是,则模型训练结束,利用步骤1中的原始图像数据集对当前分类基础模型的训练结果进行测试,获得所述图像分类模型; 步骤6:将待分类图像进行分区裁剪并依次输入所述图像分类模型,获得输出结果,采用分区决策机制对所有输出结果进行综合决策,获得最终分类结果;将待分类图像输入所述图像分类模型进行分类识别的具体过程包括: 步骤61:对所述待分类图像进行分区裁剪,获得裁剪为若干不同分区的子图; 步骤62:每一张子图依次输入所述图像分类模型,获得每张子图对应的输出结果; 步骤63:对所有子图的所述输出结果采用分区决策机制,获得所有子图的输出结果结合起来后的决策结果,作为所述待分类图像的最终分类结果;所述分区决策机制包括集成学习方法或群体决策方法。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。