山西大学李茹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山西大学申请的专利基于框架语义映射和类型感知的篇章事件抽取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115168541B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210827114.8,技术领域涉及:G06F16/334;该发明授权基于框架语义映射和类型感知的篇章事件抽取方法及系统是由李茹;卢江;梁吉业;谭红叶;王智强设计研发完成,并于2022-07-13向国家知识产权局提交的专利申请。
本基于框架语义映射和类型感知的篇章事件抽取方法及系统在说明书摘要公布了:本发明涉及知识图谱和自然语言处理领域,公开了一种基于框架语义映射和类型感知的篇章事件抽取方法及系统。系统包括编码器模块、事件检测模块以及论元识别模块。方法中框架语义映射是在事件检测模块中将汉语框架网ChineseFrameNet,CFN与篇章事件进行映射,同时在文本输入阶段对篇章进行滑窗机制的文本切分并融入触发词释义信息,从而改善了篇章事件抽取中的数据稀疏问题;而类型感知则是在论元识别模块中通过事件类型标签对篇章多事件进行分离,将篇章多事件转化为多个单事件,缓解了多值论元耦合问题,最后本发明将事件检测与论元识别两个模块的输出标签进行整合,形成完整的事件表示,在中文篇章事件抽取相关数据集上取得了良好的效果。
本发明授权基于框架语义映射和类型感知的篇章事件抽取方法及系统在权利要求书中公布了:1.一种基于框架语义映射和类型感知的篇章事件抽取方法,其特征在于:包括以下步骤: 步骤1:通过编码器模块对事件检测模块和论元识别模块的文本分别进行编码,得到篇章片段、触发词释义信息以及事件类型标签中每个字或词的向量表示; 步骤2:在事件检测模块中针对篇章事件数据稀疏问题,建立了CFN框架与中文事件的两级映射,进而融合篇章触发词释义信息和CFN相关事件句对预先定义的事件类型进行预测; 步骤3:在论元识别模块中针对多值论元耦合问题,建立了基于类型标签感知的多事件分离器,通过预先定义的事件论元角色对文本中的论元进行预测; 步骤4,将事件检测模块预测的全部事件类型标签与论元识别模块预测的所有论元标签进行拼接,即完成最终的篇章事件抽取; 所述步骤2包括CFN框架与中文事件映射和序列建模两部分;具体操作为: (1)CFN框架与中文事件映射:将篇章事件与CFN框架映射后的相关事件句、触发词释义以及滑动窗口的文本片段通过编码器模块得到片段和触发词释义的向量,为了进一步增强篇章中的长实体信息的表示,在预训练模型之后加入进一步增强其语义表示,具体计算过程见如下公式所示: ; ; 表示隐层向量,包含前向向量和后向向量,经过向量拼接作为下一层的输入; (2)序列建模:在解码阶段,将隐层输出作为CRF发射概率,CRF层转移概率矩阵表示从第个标签到第个标签的转移得分,因此对于已知的输入序列对应的输出标签结果为,定义当前序列得分的计算如下公式所示: ; 其中,表示第个位置输出为的概率;完整序列的得分等于每个位置打分之和,每个位置得分由隐层输出向量和转移矩阵共同组成;最后利用计算事件类型标签归一化后的概率,如下公式所示: ; 式中表示输出标签的归一化值,采用最大对数似然函数优化目标函数,其对数似然计算如下公式所示: ; 使用动态规划算法求得最优标签序列,表示输入序列,表示真实标签,表示预测标签,其计算如下公式所示: ; 经过融合CFN框架语义映射后的事件检测模型,能够很好的解决篇章事件中的数据稀疏问题,提升事件类型识别的准确率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。