山东省计算中心(国家超级计算济南中心);齐鲁工业大学陈作海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东省计算中心(国家超级计算济南中心);齐鲁工业大学申请的专利一种政务服务便民热线的实体关系联合抽取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116151252B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211371640.4,技术领域涉及:G06F40/295;该发明授权一种政务服务便民热线的实体关系联合抽取方法及系统是由陈作海;钱恒;高永超设计研发完成,并于2022-11-03向国家知识产权局提交的专利申请。
本一种政务服务便民热线的实体关系联合抽取方法及系统在说明书摘要公布了:本发明提供了一种政务服务便民热线的实体关系联合抽取方法及系统,将政务服务便民热线案例实体关系抽取看作三元组抽取问题,即先抽取头实体,再通过头实体相关信息抽取尾实体和关系,具体先对热线案例中的具体内容的目标文本进行编码,再通过单层指针网络编码方式抽取头实体,接着结合上下文编码信息和头实体位置编码信息,最后通过多层指针网络编码方式抽取尾实体和关系。本方法能提高对政务服务便民热线数据精准分析和处理的能力,更好地满足政务服务便民热线智能化的需求。
本发明授权一种政务服务便民热线的实体关系联合抽取方法及系统在权利要求书中公布了:1.一种政务服务便民热线的实体关系联合抽取方法,其特征在于,包括以下步骤:获取政务服务便民热线文本数据,输入到预训练语言模型ALBERT中; 预训练语言模型ALBERT对输入数据进行特征提取,挖掘深层次语义特征,得到上下文信息丰富的编码向量;对编码向量抽取头实体,然后按照关系类别抽取尾实体和关系,最后以三元组的形式输出; 三元组抽取层,包括:头实体抽取层和尾实体关系联合抽取层;所述头实体抽取层,使用指针网络解码的方式抽取头实体,具体为:把头实体特征作为条件采用层归一化LN方法将头实体特征与实体所在句子转变为向量形式的句子向量进行融合,;;其中,为输入向量中对应第个输入特征,为均值,为方差,是大于0的极小常数,与是训练参数;将头实体的标签分为开始标签与结束标签;将Transformer编码器层输出的编码向量输入到两个相同的二进制指针标注器,分别预测句子中头实体的开始位置和结束位置,得到头实体;具体操作:;;其中,为句子编码的第个输入特征,和分别表示位置的字符标记为头实体的开始位置和结束位置的概率;如果概率超过一定的值,该位置标记为H,否则标记为0;和为训练权重,和为偏置向量,为sigmoid激活函数;对头实体的实体类型进行标记;;;其中,和表示字符的标签信息,该标签信息分别表示为头实体类型的开始和结束;Q表示为设置的阀值;当时,表示此区间的对应的文本内容为标记的头实体; 所述尾实体关系联合抽取层,结合头实体的标记信息来确定与头实体相关的关系类别,接着根据关系类别来确定尾实体,对尾实体的实体类型进行标记;最后结合头尾实体信息来确定头尾实体之间的关系,完成对尾实体和关系的联合抽取;采用嵌入CLN网络层,将头实体的标注编码和句子编码进行特征融合得到新的句子编码,计算方式:;;其中,和为输入向量和中对应第个输入特征,为均值,为方差,是大于0的极小常数,与是训练参数,和为初始化的变换矩阵;尾实体的标注:;;其中,为句子编码的第个输入特征,和分别表示位置的字符标记为头实体的开始位置和结束位置的概率;如果概率超过设定的值,该位置标记为H,否则标记为0;和为训练权重,和为偏置向量,为sigmoid激活函数; 其中,预训练语言模型ALBERT由嵌入层和Transformer层组成,嵌入层通过字典将每个字符映射成字向量,输入到串联的Transformer层,通过预训练去捕捉语法和语义层面的信息,把文本中包含的语言知识编码到Transformer编码器中以参数的形式体现出来。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东省计算中心(国家超级计算济南中心);齐鲁工业大学,其通讯地址为:250014 山东省济南市历下区科院路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励