淮阴工学院冯万利获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉淮阴工学院申请的专利面向施工图审查规范知识抽取与知识图谱构建方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115905553B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211263033.6,技术领域涉及:G06F16/36;该发明授权面向施工图审查规范知识抽取与知识图谱构建方法及系统是由冯万利;刘小贝;弭云国;王云鹏设计研发完成,并于2022-10-14向国家知识产权局提交的专利申请。
本面向施工图审查规范知识抽取与知识图谱构建方法及系统在说明书摘要公布了:本发明公开了一种面向施工图审查规范知识抽取与知识图谱构建方法及系统,对施工图审查规范的内容进行规范预处理和数据标注,获取标注的数据集Data,基于GlobalPointer的实体关系联合抽取的模型,得到施工图审查规范实体关系联合抽取训练模型Model;将验证集输入Model;经稀疏多标签交叉熵解码并进行实体属性关系识别抽取,预测施工图审查规范中的三元组;并将其转换到Neo4j图数据库中,完成施工规范知识的存储工作,构建施工图审查规范知识图谱;提取审查模型数据并与知识图谱匹配,对待审查的BIM施工图文件数据提取解析,完成匹配内容转化为三维可视的智能化审图结果。本发明可有效实现了非结构化文本实体关系联合抽取、被审施工图的智能化审图,提升施工图智能化审图水平。
本发明授权面向施工图审查规范知识抽取与知识图谱构建方法及系统在权利要求书中公布了:1.一种面向施工图审查规范知识抽取与知识图谱构建方法,其特征在于,包括如下步骤: S1、对施工图审查规范的内容进行规范预处理和使用Colabeler标注工具,形成带标签的文本数据,获取标注的数据集Data;并把Data划分为训练集train_data和验证集dev_data; S2、使用训练集train_data训练使用预训练模型BERT的基于GlobalPointer的实体关系联合抽取的模型,得到施工图审查规范实体关系联合抽取训练模型Model; S3、将验证集中的单句输入Model模型,经过打分函数得到每个单句实体关系属性;利用稀疏多标签交叉熵解码进行实体属性关系识别抽取,预测出关系三元组;得到施工图审查规范实体属性关系联合抽取模型Model; S4、采用知识存储映射算法将其三元组转换到Neo4j图数据库中,完成施工规范知识的存储工作,构建施工图审查规范知识图谱; S5、提取审查模型数据并与知识图谱匹配,对待审查的BIM施工图文件数据提取解析,完成匹配内容转化为三维可视的智能化审图结果; 所述步骤S2具体包括: S2.1、建立基于GlobalPointer的实体关系联合抽取的模型,所述基于GlobalPointer的实体关系联合抽取的模型的输入为单句,输出为三元组; 所述基于GlobalPointer的实体关系联合抽取的模型首先对输入的每条有效数据中的文本内容text进行分词编码,得到token_ids,segment_ids;token_ids列表: token_ids=[X'1,X'2,X'3,...,X'n-1,X'n] 将三元组列表spo_list中的每个三元组中的实体文本subject及实体文本object进行分词编码,得到去除第一列和最后一列的token_ids; 将subject和object的token_ids与text的token_ids进行搜索寻找头实体第一个位置sh,头实体的最后一个位置st,尾实体第一个位置oh,尾实体的最后一个位置ot; 根据sh,st、oh,ot、sh,oh、st,ot分别形成subject标签、object标签、关系头标签、关系尾标签; 将token_ids与segment_ids,作为BERT模型传入数据,得到向量序列h1,h2,...hn=BERTx1,x2,...xn; BERT的输出为[batch_size,maxlength,hidden_size],并作为GlobalPointer的输入; GlobalPointer第一步经过全连接层把BERT的输出向量转换为[batch_size,maxlength,head_size*2*heads],其中heads代表实体类型的数量;head_size代表指针对于每个heads所需的线性变换的输出维度; 通过两个前馈层,依赖于跨度的开始和结束索引,来计算跨度表示:qi,ɑ=Wq,ɑhi+bq,ɑ;ki,ɑ=Wk,ɑhi+bk,ɑ,得到序列向量序列[q1,ɑ,q2,ɑ,....,qn,ɑ]和[k1,ɑ,k2,ɑ,...,kn,ɑ];其中对于类型ɑ的跨度S[i:j],开始和结束位置表示是qi,ɑ和ki,ɑ,i和j分别为头索引和尾索引; 将相对位置信息显式注入模型,ROPE位置编码应用到实体表示中,满足对于类型ɑ的跨度S[i:j]打分函数Sɑi,j为: 将BERT的输出进入GlobalPointer,使heads=2,Ssh,st、Soh,ot分别是subject、object的首尾打分,通过Ssh,st0和Soh,ot0来识别出所有的subject和object,完成NER任务; 将BERT的输出进入GlobalPointer,使heads等于关系类别数,根据sh,oh得出实体的头部关系; 将BERT的输出进入GlobalPointer,使heads等于关系类别数,根据st,ot得出实体的尾部关系; S2.2、将训练集划分为多个批次,采用每个批次训练基于GlobalPointer的实体关系联合抽取的模型参数,得到训练模型Model;通过降低损失函数来优化,损失函数为: 其中N为训练样本负类别的集合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人淮阴工学院,其通讯地址为:223003 江苏省淮安市经济技术开发区枚乘东路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。