西安交通大学裴红斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安交通大学申请的专利一种利用预测不一致样本的伪标签增强训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120087502B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510525771.0,技术领域涉及:G06N20/00;该发明授权一种利用预测不一致样本的伪标签增强训练方法是由裴红斌;海竞昕;李宇;邓辉琦;王平辉;马杰;管晓宏设计研发完成,并于2025-04-25向国家知识产权局提交的专利申请。
本一种利用预测不一致样本的伪标签增强训练方法在说明书摘要公布了:本申请提供一种利用预测不一致样本的伪标签增强训练方法,涉及深度学习技术领域,该方法包括:第一阶段,由真实标签训练集训练初始模型获得第一模型;第二阶段,由基线伪标签选择方法构建基线伪标签训练集,并与真实标签训练集构成目标训练集训练第一模型获得第二模型,保存每轮训练后的第一模型对无标签数据的预测分布为历史预测数据;第三阶段,从历史预测数据中筛选具有预测不一致性的无标签数据作为伪标签数据,其伪标签为第二模型预测的类别,预测不一致性指无标签数据的预测标签先后稳定在两个类别;以伪标签数据和目标训练集组成增强训练集训练初始模型,获得最终模型。旨在提供经过多样特征伪标签数据训练的模型,以提升最终模型性能。
本发明授权一种利用预测不一致样本的伪标签增强训练方法在权利要求书中公布了:1.一种利用预测不一致样本的伪标签增强训练方法,其特征在于,所述方法包括: 通过基线伪标签选择方法,确定无标签图像数据的伪标签,以构建基线伪标签训练集; 通过真实标签训练集和基线伪标签训练集构成的目标训练集对第一模型进行训练,并以每个训练轮次后的第一模型对无标签图像数据进行标签预测,获得对应的预测分布结果,所述无标签图像数据在所有训练轮次获得的所有预测分布结果组成对应的历史预测数据集; 在所述第一模型训练合格获得对应的第二模型的情况下,确定无标签图像数据的历史预测数据集是否满足设定条件,所述设定条件为无标签图像数据在训练过程中的标签预测先后稳定在两种不同类别标签上; 将满足所述设定条件的无标签图像数据确定为伪标签图像数据,并将最终的标签预测所稳定在的类别标签确定为所述伪标签图像数据的伪标签; 以获得的大量伪标签图像数据和所述目标训练集组成增强训练集,通过所述增强训练集对构建的初始模型进行训练,获得训练合格的标签预测模型; 其中,通过所述增强训练集对构建的初始模型进行训练,获得训练合格的标签预测模型,包括:通过所述增强训练集对构建的初始模型进行训练,在预设次数的训练后无法获得训练合格的标签预测模型的情况下,确定进行预设次数训练后的初始模型为第三模型;通过所述目标训练集对所述第三模型进行训练,并以每个训练轮次后的所述第三模型对新的无标签图像数据进行标签预测,获得对应的预测分布结果,所述新的无标签图像数据在所有训练轮次获得的所有预测分布结果组成对应的历史预测数据集;在所述第三模型训练合格的情况下,确定所述新的无标签图像数据的历史预测数据集是否满足设定条件;将满足所述设定条件的新的无标签图像数据确定为伪标签图像数据,并将最终的标签预测所稳定在的类别标签确定为所述伪标签图像数据的伪标签;以获得的大量新的伪标签图像数据和所述增强训练集组成新的增强训练集,通过所述新的增强训练集对经过预设次数训练后的第三模型进行训练,获得训练合格的标签预测模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。