陕西师范大学袁柳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉陕西师范大学申请的专利一种领域知识库中的概念自动获取方法、系统、装置及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115270776B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211049662.9,技术领域涉及:G06F40/247;该发明授权一种领域知识库中的概念自动获取方法、系统、装置及介质是由袁柳;剌媛设计研发完成,并于2022-08-30向国家知识产权局提交的专利申请。
本一种领域知识库中的概念自动获取方法、系统、装置及介质在说明书摘要公布了:本发明公开了一种领域知识库中的概念自动获取方法、系统、装置及介质;包括:基于DOM解析半结构化文档,获取文档的关键词信息;基于关键词信息,爬取Web网页数据;对Web网页数据进行动态解析,抽取三元组,构建本体;基于本体,构建终身机器学习模型;基于终身机器学习模型,获取未被命名的概念,并以三元组的形式扩充至本体知识库中。本发明能够有效整合知识结构,更加方便用户地理解和使用,同时进行本体的构建,能够根据现有的概念和属性,推理出复杂的逻辑关系,使得程序可以轻而易举的读懂语义逻辑;并且在系统不断学习的过程中,实现了web信息知识的动态获取与整合,不断地扩大领域知识库,对所构建的知识概念结构也在进行及时地更新。
本发明授权一种领域知识库中的概念自动获取方法、系统、装置及介质在权利要求书中公布了:1.一种领域知识库中的概念自动获取方法,其特征在于,包括: 基于DOM解析半结构化文档,获取文档的关键词信息; 基于关键词信息,爬取Web网页数据; 对Web网页数据进行动态解析,抽取三元组,构建本体; 基于本体,构建终身机器学习模型; 基于终身机器学习模型,获取未被命名的概念,并以三元组的形式扩充至本体知识库中; 所述基于本体,构建终身机器学习模型,具体为: 接收任务管理器所发送的任务; 基于本体知识库中的先前任务信息,对任务进行学习,并存储至本体知识库中; 学习器执行的N个学习任务及各学习任务所对应的数据集,当接收任务管理器所发送的第N+1个任务T_N+1和其对应的数据集D_N+1时,学习器利用本体知识库中的历史知识学习T_N+1,本体知识库维护先前学习到的知识,并通过学习先前任务来进行知识积累;当完成学习T_N+1后,对本体知识库进行更新; 所述基于终身机器学习模型,获取未被命名的概念,具体为:利用频繁模式和关联规则挖掘已有概念中的未知现象; FP-tree算法对现有的概念结构进行两次扫描,构建FP-tree树,通过其找出频繁项集;FP-growth算法的流程如下: 第一次扫描,对数据集进行扫描得到频繁项为1的项目集,定义最小支持度,删除小于最小支持度的项目,然后将原始数据集中的条目按项目集中降序进行排列; 第二次扫描,从上往下降序创建项头表以及FP树; 对于每个项目找到其条件模式基,递归调用树结构,删除小于最小支持度的项;如果最终呈现单一路径的树结构,则直接列举所有组合;非单一路径的则继续调用树结构,直到形成单一路径即可; 通过频繁项集在PIS中发现多个概念实体之间的频繁项集及关联规则,获取未被命名的概念。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人陕西师范大学,其通讯地址为:710119 陕西省西安市长安区西长安街620号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。