国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司江明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司申请的专利一种半自动实体标注监督方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113988064B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111399124.8,技术领域涉及:G06F40/279;该发明授权一种半自动实体标注监督方法是由江明;单超;邹云峰;黄茜;朱峰;刘云鹏;蔡明明设计研发完成,并于2021-11-19向国家知识产权局提交的专利申请。
本一种半自动实体标注监督方法在说明书摘要公布了:一种半自动实体标注监督方法及系统,方法包括以下步骤:步骤1,对第一设定数量的小样本进行标注;步骤2,训练标注模型;若标注模型质量满足要求,执行步骤4,若标注模型质量需要提升,执行步骤3;步骤3,迭代执行自动标注、标注质量监督、校对、更新训练集和训练模型,直至迭代次数达到最大迭代次数;若迭代结果标注模型的F1值不小于第一阈值,则执行步骤4;若迭代结果标注模型的F1值仍小于第一阈值,调整标签及标注规范并返回步骤1;步骤4,对剩余未标注的样本进行标注,并对标注进行监督,包括标注模型的质量监督和对标注人员的监督;步骤5,分析人工与标注的标注结果是否一致,如果不一致,整理分析所属类别。
本发明授权一种半自动实体标注监督方法在权利要求书中公布了:1.一种半自动实体标注监督方法,用于电力营销系统,其特征在于,包括以下步骤: 步骤1,标注分为两个部分,待标注句子和标注标签,实体标注工作开始时,对第一设定数量的小样本进行人工标注; 步骤2,以步骤1的标注结果作为训练集,训练标注模型;训练结束后,对标注模型的质量进行监督;如果标注模型的F1值不小于第一阈值,直接对文本进行自动标注,执行步骤4;如果F1值小于第一阈值并且大于第二阈值,执行步骤3;如果F1值不大于第二阈值,初步判断步骤1中小样本数量较少,需要增加样本重新进行训练,返回步骤1增加标注的样本数量; 步骤3,迭代执行自动标注、标注质量监督、校对、更新训练集和训练模型,直至迭代次数达到最大迭代次数,包括: 步骤3.1,使用标注模型自动标注第二设定数量的样本,形成标注结果; 步骤3.2,对步骤3.1的标注结果实施标注质量监督和校对,获得校对结果; 步骤3.3,判断是否达到最大迭代次数,若未达到最大迭代次数,继续执行步骤3.4,若已经达到最大迭代次数,结束迭代,执行步骤3.6; 步骤3.4,更新训练集,联合步骤1中的小样本标注结果和步骤3.2中获得的校对结果作为新的训练集; 步骤3.5,使用更新后的训练集训练标注模型,并且返回步骤3.1开始新一次的迭代; 步骤3.6,比较当前标注模型的F1值和第一阈值,如果当前标注模型的F1值不小于第一阈值,继续执行步骤4;如果当前标注模型的F1值仍小于第一阈值,调整标签及规范后,返回步骤1; 步骤4,对剩余未标注的样本进行标注,并对标注进行监督,包括标注模型的质量监督和对标注人员的监督;对标注模型算法的监督包括:训练测试集的F1值或通过对自动标注的文本进行人工校对来对模型进行监督; 步骤5,分析人工与标注的标注结果是否一致,如果不一致,整理分析所属类别;分析人工与标注的标注结果不一致,整理分析所属类别,包括:模型学习错误,标注人员标注错误,不在标注规范的问题。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网江苏省电力有限公司营销服务中心;国网江苏省电力有限公司,其通讯地址为:210019 江苏省南京市建邺区奥体大街9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。