中国电建集团贵州电力设计研究院有限公司;国网经济技术研究院有限公司;上海交通大学;国网浙江省电力有限公司经济技术研究院杨立获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电建集团贵州电力设计研究院有限公司;国网经济技术研究院有限公司;上海交通大学;国网浙江省电力有限公司经济技术研究院申请的专利自然语言查询智能变电站SCD文件的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114168615B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111496011.X,技术领域涉及:G06F16/242;该发明授权自然语言查询智能变电站SCD文件的方法及系统是由杨立;周青媛;杨娟;袁兆祥;韩柳;吴聪颖;宋元斌;吴冰;张文军;时云洪;银涛;杨道锦;刘羽峰;闫培丽;肖智宏;冯腾;刘文轩;曹金浩;谢小鹏;晁岱峰;艾青;王辉;刘伟军;黄江倩设计研发完成,并于2021-12-08向国家知识产权局提交的专利申请。
本自然语言查询智能变电站SCD文件的方法及系统在说明书摘要公布了:本发明提供了一种自然语言查询智能变电站二次系统SCD文件的方法及系统,包括:将SCD文件导入图数据库;获取输入图数据库的自然语言查询语句,经过知识图谱修正得到建议问句,在所述建议问句中补充省略属性,将专业术语同义词替换为标准参考词;对经过修正的所述自然语言查询语句进行多关系语义信息提取,得到的多关系语义信息表示为语义三元组,将语义三元组转化为Cypher代码段,利用组装模板将Cypher代码段拼装成Cypher查询语句;利用Cypher查询语句在所述图数据库查询相应SCD文件中的内容。本发明可以减轻初学者查询SCD数据的难度,为探索性学习SCL语言和SCD文件的结构提供更加自然、友好的支持。
本发明授权自然语言查询智能变电站SCD文件的方法及系统在权利要求书中公布了:1.一种自然语言查询智能变电站SCD文件的方法,其特征在于,包括: 导入步骤:将SCD文件导入图数据库; 信息补足步骤:获取输入图数据库的自然语言查询语句,经过知识图谱修正得到建议问句,在所述建议问句中补充省略属性,将专业术语同义词替换为标准参考词; 语义信息提取步骤:对经过修正的所述自然语言查询语句进行多关系语义信息提取,将得到的多关系语义信息表示为语义三元组; 转化步骤:根据语义三元组得到通用问句,根据所述通用问句从已有的组装模板数据库中查询相应的组装模板,将语义三元组转化为Cypher代码段,同时,根据语义三元组中主体、谓词、客体之间的关系得到相应的通用问句,根据通用问句从已有的组装模板数据库中查询相应的组装模板,利用根据语义三元组查询得到的组装模板将Cypher代码段组装为图数据库的Cypher查询语句; 查询步骤:利用所述Cypher查询语句在所述图数据库查询相应SCD文件中的内容; 所述信息提取步骤包括: 计算经过修正的所述自然语言查询语句中字符的字符向量; 对每个字符的上下文特征进行评估,得到字符之间的语言或语义关系; 根据上下文特征来识别所有主语,并识别每个主语关联的宾语及谓语,得到语义三元组; 所述转化步骤包括: 根据得到所述Cypher查询语句的一组语义三元组选择组装所述Cypher代码段的所述组装模板; 经过知识图谱修正得到建议问句包括:查找属性K[1]为值V[1]并且或者…属性K[n]为值V[n]的节点m的相关节点n的属性L[1]…和属性L[n]; 所述语义信息提取步骤借助BiLSTM模型,抽取出规范文本的上下文特征ht,对BiLSTM模型输出的隐状态进行最大池化,从而得到语句特征g,最后,将规范文本的上下文特征ht与语句特征g进行拼接,形成任务共享特征[ht;g]; 对每个待处理的句子,先抽取出规范文本中的所有候选主体,然后依据每一个候选主体的语义信息,抽取所述候选主体对应的客体和语义关系,将候选主体的抽取问题、客体和语义关系的抽取问题均建模为序列标注任务,指针标注结构通过提供一个起始位置指针和终止位置指针在文本中分割片段; 主体抽取器在接收任务共享特征后,首先使用BiLSTM模型从任务共享特征中抽取任务特定的特征,然后,使用了两个多头自注意力模型分别学习主体的起始位置特征和终止位置特征; 选取缩放点积模型作为注意力打分函数,记为BiLSTM层输出的任务特定特征,那么在自注意力机制中,查询矩阵Q、键矩阵K和值矩阵V的关系为Q=K=V=hse,注意力函数表示为下式: 其中d表示BiLSTM层输出的隐状态维度,等于2dh; 假设多头自注意力机制包含m个头,那么第i个注意力头由下式表示: 其中,是待训练的投影参数,dk=2dhm,多头自注意力机制的最终结果由各个注意力头拼接而成: 其中为待训练参数; 之后,多头自注意力机制的输出被输入到一个带有Softmax激活函数的全连接层,在每一个字符上生成标签概率分布,在主体的起始位置标注过程中,字符ct的标签计算如下式所示: 其中为训练参数,|T|记为输出标签类型的数量|T|的取值为命名实体类别加1; 将第一个多头自注意力机制的输出hse-sta与任务特定特征hse拼接后初始化第二个多头自注意力机制的Q、K、V参数; 记第二个多头自注意力机制的输出为那么在主体的终止位置标注过程中,字符ct的标签计算如下式所示: 其中为训练参数; 经过上述过程,主体抽取器就将候选主体的识别分解为了两个序列标注任务,第一个序列标注任务负责识别候选主体的起始位置,若某个字符被识别为候选主体的起始字符,那么该字符对应的位置就会被标注上该主体的命名实体类型标签,第二个序列标注任务负责识别候选主体的终止位置,其标注过程与起始位置标注过程相同; 最终,使用交叉熵衡量主体抽取器预测的概率分布与真实分布之间的损失,主体抽取器的训练损失函数写为: 其中,和分别为第i个字符的真实起始位置和终止位置标签,n为设计规范文本的长度; 在获取所有候选主体后,客体与语义关系抽取器负责针对每一个候选主体,抽取其对应的所有客体以及与主客体间的语义关系; 在客体与语义关系抽取器中,首先需要对给定的主体进行语义编码,将给定主体所对应的任务共享特征的片段,输入到一个LSTM模型中,LSTM模型输出的最后一个隐状态作为给定主体的语义编码,将给定主体的语义编码与任务共享特征的每一个特征向量进行拼接,得到一个新的特征矩阵,这个新的特征矩阵被认为是既携带了上下文特征,同时还携带了给定主体特征的语义编码结果; 客体与语义关系抽取器的后续计算流程包括:第一步,将携带有特定主体语义信息的特征矩阵输入到一个BiLSTM模型中,从而抽取任务特定的特征;第二步,借助两个多头自注意力机制以及全连接层构造两个序列标注任务,第一个序列标注任务负责标注所有候选客体的起始位置,第二个序列标注任务负责标注所有候选客体的终止位置;与主体抽取器不同的是,一个字符若被标注为候选客体的起始位置或终止位置,其标签不是命名实体的类型,而是给定主体与该候选客体的语义关系类型; 对于一个给定主体,客体的起始位置和终止位置标注过程中,字符ct的标签计算分别如下所示: 其中,分别为第一个多头自注意力机制和第二个多头自注意力机制在时间戳t的输出;bope-sta、以及均为训练参数;|T'|为输出标签类型的数量,|T'|取值为语义关系的数量加1;最终,使用交叉熵衡量客体与语义关系抽取器预测的概率分布与真实分布之间的损失,客体与语义关系抽取器的训练损失函数为: 其中,分别为第i个字符的真实起始位置和终止位置标签,n为规范文本的长度; 在模型训练阶段,通过共享语义编码器提供的任务共享特征,主体抽取器和客体与语义关系抽取器联合训练,在每个训练实例中,从规范文本的标准数据集中随机选取一个主体作为客体与语义关系抽取器的输入,通过衡量模型预测结果与标准结果之间的差异,计算主体抽取器和客体与语义关系抽取器的损失函数值,最后将两部分损失相加构成联合模型最终的损失函数: 使用Adam算法对模型最终的损失函数进行优化,从而使主体抽取、客体与语义关系抽取过程中产生的误差相互影响,每个子任务产生的误差受到其它任务的约束,进而强化命名实体与语义关系之间的潜在相互。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电建集团贵州电力设计研究院有限公司;国网经济技术研究院有限公司;上海交通大学;国网浙江省电力有限公司经济技术研究院,其通讯地址为:550081 贵州省贵阳市市辖区高新区黔灵山路357号德福中心A6栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。