Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西南石油大学罗仁泽获国家专利权

西南石油大学罗仁泽获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西南石油大学申请的专利一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116244451B

龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310332143.1,技术领域涉及:G06F16/36;该发明授权一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法是由罗仁泽;陈翔;雷璨如;武娟;王清松;赵丹;易玺;廖波;曹瑞设计研发完成,并于2023-03-31向国家知识产权局提交的专利申请。

一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法在说明书摘要公布了:本发明提出一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法,具体实施方法为:首先标注数据集,并将数据集进行划分;构建加入了傅里叶变换‑幅频特性计算模块的深度学习模型,引入幅频自适应权重系数θ,动态调整θ,来调整模型的特征提取能力,从而快速、准确抽取领域数据知识;接着使用余弦相似度计算词向量相似度,并将余弦相似度与手动设定的阈值比较,大于阈值则融合相关实体;然后根据数据语法结构编制规则模板,并且人工筛选后进行补充或删减,抽取两两实体间的关系;最后将实体和关系按主谓宾三元组关系进行存储,导入图数据库,其中节点表示实体,边表示实体间的关系,从而快速构建知识图谱。

本发明授权一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法在权利要求书中公布了:1.一种融合快速傅里叶变换知识抽取模型的知识图谱构建方法,其特征在于包括以下步骤: 步骤1、处理动车组高级修数据集,将无明确语义,缺失、错误的数据删除;标记动车组高级修数据,标注方式为BIOES;对动车组高级修数据集进行标注,将标注好的数据集按比例分割为训练集、验证集和测试集;分析数据集,构建知识本体;对数据集进行预处理,具体处理方式为: 1填补数据集中空值;实体指描述具体事物的词语,对实体词第一个字,实体词中间每个字,实体结尾最后一个字,非实体字进行数据标注; 按BIOES方法标注数据,具体做法为:对数据进行形似X-Y的标注,其中,X为B、I、O、E、S字母中的一个,B表示实体的首位,I表示实体的中间位置,E表示实体的尾部,O表示词处于实体外部,S表示可以单独表示一个实体的单字;Y为实体类别; 2将预处理后动车组高级修的数据集定义为Input,划分为训练集、验证集和测试集; 步骤2、搭建知识抽取模型,训练模型,自动抽取实体,具体步骤如下: 搭建BERT-DFC模型,采用预训练的两个中文BERT模型;模型隐藏层维度为M,注意力机制头数为n,n取值范围6~12;其中一个模型加入快速傅里叶变换和幅频特性计算层提取数据特征,具体做法为: 使用步骤1获得的数据Input,使用BERT-DFC模型抽取知识;BERT-DFC采用预训练的两个中文BERT模型作为子模型,分别称为第一BERT和第二BERT模型;每个BERT模型的隐藏层维度为M,多头注意力机制有n头;将步骤1得到的数据Input输入第一BERT模型,输出HF连接全连接层维度降维至N,T表示模型待分类实体总类别数,N取值范围为T~2T,获得输出张量HN,第二BERT模型输入与第一BERT模型相同,输出为HO; HF=BERT1Input HO=BERT2Input HN=softmaxWf·HF+bf 式中:Wf和bf分别为降维矩阵和偏置, 式中,ei表示某一维的特征数据, 获得的输出HN可以看作是一个周期为N的离散数字信号,对HN进行快速傅里叶变换运算,获得HN的频域信息表示HFFT,FFT·表示离散信号的快速傅里叶变换运算,然后将HFFT实部和虚部取模计算HFFT的幅频特性表示HE; HFFT=FFTHN HE=|HFFT| 定义幅频自适应权重系数θ,使用θ显化或弱化HE对特征的表征能力:当模型性能较高时,通过放大幅频自适应权重系数θ,提高幅频特征对模型的影响,进一步提高模型对领域性特征的提取能力;当模型性能较低时,通过降低幅频自适应权重系数θ,缩小幅频特征对模型的影响,使第二BERT模型优先学习领域特征,通过模型训练提升模型性能;有 H'E=θ·HE·We+be; 其中,We和be为线性变换矩阵和偏置,F为模型评估参数,引入幅频自适应权重系数θ,优化特征融合效果,θ定义如下: 若模型精准率为P,召回率为R,则有: 其中TP为真正例,FP为假正例,FN为假负例,则F1值的计算方式如下, 定义模型评估参数F,当F10.37,则: F=F1 当F1≤0.37,则: F=0.37 将H'E和HO拼接Concat·,得到模型输出HL,连接全连接层进行最终实体预测分类; HL=ConcatHO,H'E=[HO,HE] BERT-DFC通过反向传播获得训练,在多分类任务中,模型的损失L使用多分类交叉熵损失函数计算,并采用自适应学习率的梯度下降算法进行模型优化,优化目标是最小化损失L;多分类交叉熵损失函数如下,模型通过梯度反向传播进行训练,当模型的损失多轮训练后,不再明显下降,则停止模型训练, 式中:N为待分类的实体总数;BERT-DFC输出HL连接全连接层降维到N,降维后的词向量中,取列向量最大值的列序号,决定第i个观测样本的类别,若第i个观测样本类别判断正确,也就是被判断为真实类别第c类时,则yic取值1,否则为0;pic表示第i个观测样本类别预测为真实类别c的概率; 步骤3、将抽取到的实体进行实体融合,若共抽取到p个实体,将p个实体经过模型的输出向量{HL1,HL2,HL3…HLp}进行线性变换,变换为均值为0、协方差矩阵为单位阵的向量{H'L1,H'L2,H'L3…H'Lp};取任意两实体词向量W1和W2,计算词向量余弦相似度,获得余弦相似度α,结果范围0~1;设定相似度阈值β,取值范围0~1;将α相似度与阈值β相比较,若α大于阈值β,则融合实体,融合为词字数长度较短一方,若α小于阈值表示两实体不能融合; 实体词向量余弦相似度计算方法为: 步骤4、根据规则模板提取数据集中两两实体具有的关系,实现实体两两匹配;根据动车组转向架和其对应检修工艺方法的文本表示方式,基于动车组检修本体关系约束,采用规则模板的关系抽取方法,抽取两两实体间的关系,构建检修、检查、测量、更换的实体关系模板;在关系抽取中,基于上述模板进行匹配;规则模板根据数据集制定,并且人工筛选后进行补充或删减,最后根据数据语法结构编制规则模板; 步骤5、将实体和关系按三元组关系进行存储,使用图数据库构建知识图谱; 将实体和关系按主谓宾三元组关系进行存储,导入图数据库;图数据中节点代表实体,两个实体间的连线代表实体间的关系,搭建知识图谱。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南石油大学,其通讯地址为:610500 四川省成都市新都区新都大道8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。