中国铁路设计集团有限公司杨绪坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国铁路设计集团有限公司申请的专利一种铁路桥梁设计标准知识图谱快速构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119831016B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411863102.6,技术领域涉及:G06N5/022;该发明授权一种铁路桥梁设计标准知识图谱快速构建方法是由杨绪坤;齐春雨;苏林;王凯军;渠涧涛;齐成龙;孟鹤;孟庆菊;王涵;刘新宇;王自超;赵飞飞;孙思远设计研发完成,并于2024-12-17向国家知识产权局提交的专利申请。
本一种铁路桥梁设计标准知识图谱快速构建方法在说明书摘要公布了:本发明公开了一种铁路桥梁设计标准知识图谱快速构建方法,包括:S1,采集数据并进行预处理;S2,采用BERT预训练模型和Bi‑LSTM模型对所述处理后数据中文本序列转化已标注的标签序列{y1,y2…yn};S3,利用条件随机场CRF和图神经网络GNN技术,识别并标注实体、属性及其关系,形成知识图谱的节点和边,得到完整的知识图谱KG;S4,利用动态拓扑优化算法实时调整所述完整的知识图谱KG结构。该方法快速整合和优化设计标准数据,减少数据冗余并有效处理数据的新增和变更,从而提升知识图谱的构建速度和维护效率。
本发明授权一种铁路桥梁设计标准知识图谱快速构建方法在权利要求书中公布了:1.一种铁路桥梁设计标准知识图谱快速构建方法,其特征在于,包括以下步骤: S1,采集数据并进行预处理:采集与铁路桥梁设计相关的标准文档中的数据;通过数据清洗技术去除采集数据中的冗余数据和噪声数据,得到处理后数据,其中: 所述处理后数据包含多个文本序列,第一个文本序列S={w1,w2,…,wn},wi是相应文本序列S中第i个单词,i=1,2,3…n; S2,采用BERT预训练模型和Bi-LSTM模型将所述文本序列S转化为高信息密度的结构化数据,包括: S2-1,提取嵌入向量:采用BERT预训练模型对所述文本序列S进行嵌入处理,得到文本序列S的嵌入向量X={x1,x2,…,xn};其中,xi是文本序列S中第i个单词wi的词向量; S2-2,根据嵌入向量X提取文本序列S中每个单词对应的上下文特征: S2-2-1,遍历嵌入向量X={x1,x2,…,xn},将每个单词的词向量作为映射函数的输入,计算得到文本序列S中每个单词对应的初始上下文特征,得到初始上下文特征集合H={h0w1,h0w2,…,h0wn}; S2-2-2,遍历所述初始上下文特征集合H={h0w1,h0w2,…,h0wn},将集合H中的每个单词的初始上下文特征分别输入到预训练BERT模型中,BERT模型的N层Transformer编码器输出每个单词的上下文特征,并组成每个单词的上下文特征集合HS={hNw1,hNw2,…,hNwn}; S2-3,基于Bi-LSTM模型提取最终上下文特征: 遍历集合HS={hNw1,hNw2,…,hNwn},将集合HS中的每个上下文特征作为Bi-LSTM模型的输入,捕捉文本序列S中的双向上下文依赖关系,得到文本序列S中每个单词对应的最终上下文特征,并组成最终上下文特征序列CS={c1,c2,…,cn}; S2-4,计算最终上下文特征序列CS的平均,得到平均向量sg,sg为文本序列S的整体语义特征:sg=avg{c1,c2,…,cn}; S2-5,构建关系集合R: 在预训练BERT模型对文本序列进行处理的过程中,从文本序列中识别出实体,基于不同实体之间的上下文信息推断出它们之间的语义关系,将语义关系嵌入到关系向量空间中得到关系向量,并添加到关系集合R中,得到关系集合R={r1,r2,…,rk,…rt},其中,t为关系集合R中关系向量的总数量,关系向量rk表示文本序列S中某个特定的关系类型或语义联系; S2-6,根据最终上下文特征序列CS和平均向量sg,采用注意力机制通过线性映射和非线性变换计算文本序列S中每个单词在关系向量rk下的注意力对齐得分,并组成注意力对齐得分集合{e1k,e2k,…,enk},注意力对齐得分eik用于衡量最终上下文特征ci在关系向量rk下的权重; S2-7,使用Softmax函数对注意力对齐得分集合{e1k,e2k,…,enk}进行归一化,得到每个单词在当前目标关系rk下的注意力权重,并组成注意力权重集合{α1k,α2k,…,αnk}; S2-8,通过注意力权重集合{α1k,α2k,…,αnk}对最终上下文特征序列CS={c1,c2,…,cn}进行加权求和,得到关系向量rk下的文本序列S的特征向量sk: 其中,文本序列S在关系向量rk下的特定语义信息会被整合在特征向量sk中,n为文本序列S的单词总数量,d为每个单词的特征维度; S2-9,将特征向量sk输入到关系门控单元,关系门控单元根据特征向量sk和激活函数计算得到门控向量G;使用门控向量G对特征向量sk进行过滤,得到过滤后特征向量其中,门控向量G过滤掉对关系向量rk无关的特征信息且保留对实体标注最有利的特征,激活函数为Sigmoid; S2-10,将过滤后特征向量中的每个元素分别输入到Bi-LSTM网络的隐藏层中,输出过滤后特征向量中的每个元素对应的隐藏状态,即文本序列中每个单词对应的隐藏状态,得到隐藏状态集合 S2-11,将隐藏状态集合中每个隐藏状态分别输入到Bi-LSTM网络的实体标注层,实体标注层输出为文本序列S中所有单词的标签,并组成标签序列{y1,y2…yn}; S2-12,根据标签序列{y1,y2…yn},确定文本序列S中与关系向量rk相关的头实体和尾实体,并根据确定的头实体和尾实体对标签序列{y1,y2…yn}进行标注; S3,利用条件随机场CRF和图神经网络GNN技术,识别并标注设计标准中的实体、属性及其关系,形成知识图谱的节点和边,以构建完整的知识图谱KG; S4,利用动态拓扑优化算法实时调整所述完整的知识图谱KG结构,具体步骤如下: S4-1,对所述完整的知识图谱KG进行初步分析,通过计算每个节点的度,评估每个节点在所述完整的知识图谱KG中的重要性,根据节点的度计算每条边的权重,边的权重反映节点之间的关系强度; S4-2,根据所述完整的知识图谱KG中每个节点的度和每条边的权重,制定动态拓扑调整策略优化知识图谱的结构: 将所述完整的知识图谱KG中具有相同或相似属性的节点中度小于dmin的节点作为冗余节点,对所述完整的知识图谱KG中的冗余节点进行合并,删除冗余节点,并将冗余节点的连接关系转移至度较高的节点,得到实体集合E′;根据节点的度的计算公式,计算此时所述完整的知识图谱KG中节点的度,将度为零的节点作为孤立节点,得到孤立节点集合I,根据孤立节点集合I将孤立节点从知识图谱中移除; S4-3,根据所述完整的知识图谱KG中边的权重,对边进行优化,遍历所述完整的知识图谱KG中所有边的集合VR={vr1,vr2,…,vrk},将权重小于或等于阈值的边在所述完整的知识图谱KG中进行删除,如果删除的边将所述完整的知识图谱KG中某些节点断开,且这些节点的度变为零,则将这些节点视为孤立节点并删除,所述完整的知识图谱KG中删除边操作后剩余的节点之间的连接关系会有所变化,则将重新执行S4优化知识图谱KG。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国铁路设计集团有限公司,其通讯地址为:300308 天津市滨海新区自贸试验区(空港经济区)东七道109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励