中国电子科技集团公司第十研究所杨露获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第十研究所申请的专利一种基于概率模型和零样本分类模型的实体类型预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117009527B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311004493.1,技术领域涉及:G06F16/355;该发明授权一种基于概率模型和零样本分类模型的实体类型预测方法是由杨露设计研发完成,并于2023-08-08向国家知识产权局提交的专利申请。
本一种基于概率模型和零样本分类模型的实体类型预测方法在说明书摘要公布了:本发明公开了一种基于概率模型和零样本分类模型的实体类型预测方法,其包括:分别从图谱中筛选出头实体和尾实体为待预测实体的三元组数据,合并、汇总得到三元组数据中谓词集合;根据谓词集合中各个谓词对应的三元组数据中头实体类型、尾实体类型,得到谓词对应三元组数据中头实体类型、尾实体类型作为待预测实体类型的概率;基于谓词对应三元组数据中头实体类型、尾实体类型作为待预测实体类型的概率降序排列的结果,取前N个概率对应的实体类型作为待预测实体的候选实体类型;将三元组数据进行拼接,形成待分类文本与分类标签,即候选实体类型,调用零样本文本分类模型,得到待预测实体的类型预测结果。本发明的预测效率高。
本发明授权一种基于概率模型和零样本分类模型的实体类型预测方法在权利要求书中公布了:1.一种基于概率模型和零样本分类模型的实体类型预测方法,其特征在于,包括: 步骤1:分别从图谱中筛选出头实体和尾实体为待预测实体的三元组数据,合并、汇总得到三元组数据中谓词集合; 步骤2:根据谓词集合中各个谓词对应的三元组数据中头实体类型、尾实体类型,得到谓词对应三元组数据中头实体类型、尾实体类型作为待预测实体类型的概率; 步骤3:基于谓词对应三元组数据中头实体类型、尾实体类型作为待预测实体类型的概率降序排列的结果,取前N个概率对应的实体类型作为待预测实体的候选实体类型; 步骤4:将步骤1中的三元组数据进行拼接,形成待分类文本与分类标签,即候选实体类型,调用零样本文本分类模型,得到待预测实体的类型预测结果; 所述步骤2包括: 步骤21:计算、统计各个谓词对应的三元组数据中头实体类型、尾实体类型; 步骤22:分别计算步骤21中头实体类型、尾实体类型对应的三元组数量与谓词对应所有三元组数量的比例; 步骤23:依次计算谓词对应三元组数据中头实体类型、尾实体类型作为待预测实体类型的概率; 所述步骤21包括: 考虑待预测实体e作为头实体的情况,依次统计、计算Tripleshead中谓词为ri的三元组占总三元组的比例pi; 考虑待预测实体e作为尾实体的情况,依次统计、计算Triplestail中谓词为rj的三元组占总三元组的比例pj; 当待预测实体e作为头实体时,合并、汇总得到Tripleshead中谓词集合|rn|;通过查询图谱数据,计算、统计出词语rn作为三元组谓词时,三元组头实体类型及相应的占比为: |{typehead_i,phead_i}| 其中,typehead_i∈Typehead表示头实体类型;phead_i表示Tripleshead中头实体类型为typehead_i的三元组数量占谓词为r的所有三元组总数量的比例。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十研究所,其通讯地址为:610000 四川省成都市金牛区茶店子东街48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励