中国人民解放军海军工程大学崔良中获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军海军工程大学申请的专利基于预训练模型和词义增强的事件抽取系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119848229B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411890968.6,技术领域涉及:G06F16/334;该发明授权基于预训练模型和词义增强的事件抽取系统及方法是由崔良中;方睿;吕晓;周钢;郭晖;黄颖设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。
本基于预训练模型和词义增强的事件抽取系统及方法在说明书摘要公布了:本发明公开了基于预训练模型和词义增强的事件抽取系统及方法,领域词向量获取模块得到领域词向量;数据集构造模块获取特定领域文本序列数据集;事件抽取模型构造模块构建事件抽取模型;训练模块将领域词向量作为事件抽取模型中Soft‑lexicon子模型中训练的初始设置,并利用已标注特定领域文本序列数据集对事件抽取模型进行训练;事件抽取模块利用训练好的事件抽取模型预测待检测特定领域文本序列数据集的标签序列结果。本发明通过利用预训练LERT子模型和利用Soft‑lexicon子模型将领域词向量的领域词汇信息纳入字符表示,并在模型中引入CRF层,提高事件抽取任务中标签标注的准确性,解决了特定领域事件抽取中,标注数据稀缺和专业性强、语境复杂的问题。
本发明授权基于预训练模型和词义增强的事件抽取系统及方法在权利要求书中公布了:1.一种基于预训练模型和词义增强的事件抽取系统,其特征在于,包括: 领域词向量获取模块用于利用特定领域事件公开的文字资料,构建特定领域语料库,通过对特定领域语料库进行训练和评估得到领域词向量; 数据集构造模块用于获取特定领域数据集,将特定领域数据集格式转换为序列标注格式,得到已标注特定领域文本序列数据集; 事件抽取模型构造模块用于以特征提取层、特征融合层和输出解码层为模型框架,构建事件抽取模型; 所述特征提取层通过事件抽取模型中的LERT子模型和Soft-lexicon子模型将已标注特定领域文本序列数据集进行字符级别处理和词汇级别处理,获得字符级别的嵌入表示和词汇级别的嵌入表示; 所述特征融合层对字符级别的嵌入表示和词汇级别的嵌入表示进行融合拼接操作,获得融合拼接后的融合向量; 所述输出解码层捕捉融合向量中字符的长距离依赖关系,整合局部特征,获得各个字符的标签序列,利用CRF层,计算已标注特定领域文本序列数据集中每个基于字符组合的标签序列组合的概率,形成事件抽取模型; 训练模块用于将领域词向量输入事件抽取模型中的Soft-lexicon子模型中进行初始化设置,在Soft-lexicon子模型初始化设置后,利用已标注特定领域文本序列数据集对事件抽取模型进行训练,获得训练好的事件抽取模型; 事件抽取模块用于根据待检测特定领域文本序列数据集,利用训练好的事件抽取模型,计算检测特定领域文本序列数据集中每个基于字符组合的标签序列组合的概率,获得检测特定领域文本序列数据集中最高概率的标签序列组合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军工程大学,其通讯地址为:430000 湖北省武汉市解放大道717号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励