中国科学院软件研究所黄克振获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院软件研究所申请的专利基于迁移学习的网络安全命名实体和关系联合抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113919351B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111151177.8,技术领域涉及:G06F40/295;该发明授权基于迁移学习的网络安全命名实体和关系联合抽取方法及装置是由黄克振;连一峰;张海霞;彭媛媛;刘倩设计研发完成,并于2021-09-29向国家知识产权局提交的专利申请。
本基于迁移学习的网络安全命名实体和关系联合抽取方法及装置在说明书摘要公布了:本发明公开了一种基于迁移学习的网络安全命名实体和关系联合抽取方法及装置,包括:对网络安全威胁情报进行网络安全命名实体及关系联合标注,构建网络安全威胁情报语料库;基于自然语言语料库预训练深度神经网络;将预训练深度神经网络与一分类器组合,构建初始联合抽取模型;基于网络安全威胁情报语料库,对初始联合抽取模型进行训练;将目标数据输入训练好的联合抽取模型,得到网络安全命名实体和关系联合抽取结果。本发明能够同时标注网络安全命名实体和关系,有效规避先实体后关系的串行抽取模式存在的误差传递问题,降低网络安全领域实体及关系抽取对专家经验的依赖,增强模型的移植性,减少网络安全领域内标注数据集少对模型训练带来的困扰。
本发明授权基于迁移学习的网络安全命名实体和关系联合抽取方法及装置在权利要求书中公布了:1.一种基于迁移学习的网络安全命名实体和关系联合抽取方法,其步骤包括: 1对网络安全威胁情报进行网络安全命名实体及关系联合标注,构建网络安全威胁情报语料库; 2基于自然语言语料库预训练深度神经网络,得到提取词语特征表示向量的预训练深度神经网络;其中,所述预训练深度神经网络为预训练BERT模型;其中,所述基于自然语言语料库预训练深度神经网络,包括: 利用自然语言组织规律,对自然语言语料库中的自然语言语料进行分词,得到初始词典; 对自然语言中部分的分词进行掩盖; 将掩盖后的自然语言语料输入深度神经网络,通过预测掩盖分词,以得到提取词语特征表示向量的预训练深度神经网络; 3将预训练深度神经网络与一分类器组合,构建初始联合抽取模型;其中,所述分类器的构建方法包括:使用条件随机场算法; 4基于网络安全威胁情报语料库,使用迁移学习方法对初始联合抽取模型进行训练,获取训练好的联合抽取模型;其中,所述基于网络安全威胁情报语料库,使用迁移学习方法对初始联合抽取模型进行训练,包括: 利用词分片技术、初始词典及自然语言组织规律对网络安全威胁情报语料库中的网络安全威胁情报进行分词,得到若干词汇; 生成词汇的初始嵌入向量,所述初始嵌入向量由该词汇在初始词典中的词序、该词汇所对应的句子在网络安全威胁情报中的位置和该词汇在本条网络安全威胁情报中的位置组成; 将所述初始嵌入向量传递至预训练深度神经网络,并将提取的词汇特征表示向量传入条件随机场进行实体与实体间关系的标记标签分类; 基于实体与实体间关系的标记标签分类,并利用迁移学习的参数微调方法,得到训练好的联合抽取模型; 5将非结构化网络安全威胁情报输入训练好联合抽取模型,得到网络安全命名实体和关系联合抽取结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院软件研究所,其通讯地址为:100190 北京市海淀区中关村南四街4号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励