中国航空综合技术研究所王振宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国航空综合技术研究所申请的专利基于循环BERT和角标记的航空事故文本数据抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119377742B 。
龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411521325.4,技术领域涉及:G06F18/24;该发明授权基于循环BERT和角标记的航空事故文本数据抽取方法是由王振宇;张祥春;曾照洋;彭文胜;李永红设计研发完成,并于2024-10-29向国家知识产权局提交的专利申请。
本基于循环BERT和角标记的航空事故文本数据抽取方法在说明书摘要公布了:本发明属于自然语言处理技术领域,具体涉及基于循环BERT和角标记的航空事故文本数据抽取方法,其包括:S1、使用双循环BERT模型识别航空事故报告文本数据的触发词;S2、使用分类器模型联合计算航空事故报告的文本数据论元向量;S3、根据文本数据触发词的向量和论元标签计算文本数据论元向量的总置信度;S4、使用角标记矩阵解码航空事故报告文本数据的事件三元组,得到文本数据的总损失值;S5、根据总损失值判断抽取航空事故报告文本数据。本发明通过双循环训练模型识别语境信息和论元位置,进而联合计算论元置信度降低冗余错误和级联误差,增加三元组预测正确率,使用角标记方法降低模型复杂度,增加抽取结果全面性。
本发明授权基于循环BERT和角标记的航空事故文本数据抽取方法在权利要求书中公布了:1.一种基于循环BERT和角标记的航空事故文本数据抽取方法,其特征在于,其包括: S1:使用双循环BERT模型识别航空事故报告文本数据的触发词; 获取航空事故报告的文本数据,进行文本数据特征向量嵌入,将文本数据的嵌入向量编码为标签序列,进行文本数据触发词位置嵌入标注;将位置嵌入的特征向量经BERT模型进行二次编码处理,识别出论元向量,完成文本数据触发词训练,具体为: 其中,为文本数据触发词的向量;softmax为函数映射关系;Wtrigger为文本数据触发词语境信息向量的权重;hi为第i个触发词的语境信息的向量;btrigger为文本数据触发词的向量偏差;i为航空事故报告文本数据编号; S2:使用分类器模型联合计算航空事故报告的文本数据论元向量; 使用双循环BERT对特征向量进行联合表征,通过分类器模型计算文本数据论元向量的概率,将文本数据联合论元头部词概率与联合论元尾部词概率组合,得到预测的文本数据论元标签为: 其中,为预测的文本数据第i个论元向量;为第i个论元头部词概率;为第i个论元尾部词概率; S3:根据步骤S1中的文本数据触发词的向量和步骤S2中的文本数据论元标签计算文本数据论元向量的总置信度CN为: 其中,CN为文本数据论元向量的总置信度;Π为乘积运算;Confidence为置信度计算函数映射; S4:使用角标记矩阵解码航空事故报告文本数据的航空事故事件三元组,得到文本数据的总损失值; S41:将步骤S3中文本数据论元向量的总置信度CN最高的论元向量存储在角标记矩阵R中进行解码特征标记;使用角标记矩阵赋值函数计算文本数据的航空事故事件三元组特征值为: 其中,为文本数据的航空事故事件三元组特征值;R为航空事故事件三元组的角标记矩阵;为航空事故事件三元组中主体词的向量;O为航空事故事件三元组中客体词的向量;为主体词与客体词的循环计算;φ为ReLU激活函数映射;W为分类器模型训练的权重参数;为主体词向量和客体词向量的拼接运算;b为分类器模型训练的偏置参数; S42:根据触发词预测损失值Ltrigger、论元预测损失值Larg和角标记预测损失值Lrel加权求和得到文本数据的总损失值Ltotal为: Ltotal=αLtrigger+βLarg+γLrel 其中,Ltotal为文本数据的总损失值;Ltrigger为触发词预测损失值;Larg为论元预测损失值;Lrel为角标记预测损失值;α为触发词预测参数;β为论元预测参数;γ为角标记预测参数; S5:针对步骤S41中的文本数据的航空事故事件三元组特征值,设定误差输出阈值;当步骤S42中输出的文本数据的总损失值Ltotal大于或者等于所述误差输出阈值时,使用反向传播算法更新步骤S2中的分类器模型的权重矩阵参数和偏置项参数,返回步骤S2继续执行;当步骤S42中输出的文本数据的总损失值Ltotal低于所述误差输出阈值时,输出步骤S41中的航空事故事件三元组作为抽取到的航空事故报告文本数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国航空综合技术研究所,其通讯地址为:100028 北京市朝阳区东直门外京顺路7号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励