Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆大学白久林获国家专利权

重庆大学白久林获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆大学申请的专利一种土木规范领域知识图谱构建方法及构建系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116050408B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310092861.6,技术领域涉及:G06F40/289;该发明授权一种土木规范领域知识图谱构建方法及构建系统是由白久林;陈耀坤;刘毅设计研发完成,并于2023-02-07向国家知识产权局提交的专利申请。

一种土木规范领域知识图谱构建方法及构建系统在说明书摘要公布了:本发明涉及一种土木规范领域知识图谱构建方法及构建系统,包括将规范文本中需要抽取的语句筛选出来进行修改,选取符合Schema标签定义的句子,使其适合神经网络模型的抽取;将筛选出来的部分文本进行模型训练,根据设计好的三元组Schema标签对训练集进行数据标注,得到土木规范文本领域的三元组训练集;构建CE‑CasRel模型,用标注后的数据集进行训练,并用验证集进行验证;将得到待抽取的规范文本输入到训练好的CE‑CasRel模型中,抽取出土木规范领域的三元组,并将其存储到json文件中;读取json文件,解析三元组数据,使用Neo4j的API接口,建立土木规范领域知识图谱并实现可视化;满足智能审图对于知识图谱的需求。

本发明授权一种土木规范领域知识图谱构建方法及构建系统在权利要求书中公布了:1.一种土木规范领域知识图谱构建方法,其特征在于,包括如下步骤: S1、将规范文本中需要抽取的语句筛选出来,对筛选出来的文本格式和文本句式进行修改,选取符合Schema标签定义的句子,使其适合神经网络模型的抽取; S2、将步骤S1筛选出来的部分文本进行模型训练,并将文本进行语句分割,得到若干语句,并根据设计好的三元组Schema标签对训练集进行数据标注,得到土木规范文本领域的三元组训练集; S3、构建CE-CasRel模型,用步骤S2标注后的数据集进行训练,并用验证集进行验证;其中 在构建CE-CasRel模型时,使用的预训练模型为在土木领域数据集上优化过的BERT模型; S4、重复步骤S1和S2将得到待抽取的规范文本输入到训练好的CE-CasRel模型中,抽取出土木规范领域的三元组,并将其存储到json文件中; S5、读取json文件,解析三元组数据,使用Neo4j的API接口,建立土木规范领域知识图谱并实现可视化; 所述步骤S2的具体过程为: S21、利用正则表达式将分割后的句子整理到同一文件夹下,得到待标注的数据集;其中正则规则定义为根据句号、分号、冒号作为分割句子的标志; S22、按照预设比例,将数据集划分为数据集和测试集,利用标注软件对训练集进行标注,得到用于训练知识抽取的三元组训练集; S23、为了进行三元组抽取和知识图谱构建,将抽取的三元组训练集根据新的Schema标签定义规则分为实体标签和关系标签,实体标签MSub、Sub、Prop表示审图中需要审查的对象,关系标签Sub_Prop、Prop_Bx、Bx_RProp为规范条文最基础的三个关系,表示“某一个主体”的“某项属性”“应该满足”“某种规范要求”; 所述步骤S3的具体过程为: S31、构建CE-CasRel模型,在编码器端使用利用土木领域数据集重新预训练过的BERT模型替代原有编码器,称为CEBERT;在解码端为了解决实体嵌套问题,使用层叠式指针标注方法;并且在预测三元组的尾实体前,将头实体的特征向量作为条件,对特征向量做一次ConditionalLayerNormalization; S32、将标注后的训练集文本作为输入,进入CEBERT编码器;由编码器CEBERT对每条的规范条文进行多头注意力、层归一化处理和残差连接操作,提取文本特征,得到句子级别向量表示; S33、将经过预训练模型CEBERT后得到的向量表示传入解码器的头实体识别层,首先利用一个线性层和一个sigmoid激活函数判断每个token是不是头实体的start或end;然后,利用最近匹配原则将识别到的start和end配对获得候选头实体集合; S34、接着随机抽取一个头实体,将该头实体作为条件,对句子级别的向量表示做一次CLN;将CLN处理后的句子向量表示作为输入,同样通过一个线性层和一个sigmoid激活函数,用于预测不同关系下的尾实体位置; S35、CE-CasRel模型训练结束后,用测试集数据对训练后的模型进行验证,达到要求的精确对和召回率后,保留训练得到模型权重参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400030 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。