重庆邮电大学许国良获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种融合恶意词典与Bert预训练模型的恶意URL检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119884923B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411901792.X,技术领域涉及:G06F18/2415;该发明授权一种融合恶意词典与Bert预训练模型的恶意URL检测方法是由许国良;严智晖设计研发完成,并于2024-12-23向国家知识产权局提交的专利申请。
本一种融合恶意词典与Bert预训练模型的恶意URL检测方法在说明书摘要公布了:本发明涉及一种融合恶意词典与Bert预训练模型的恶意URL检测方法,属于信息安全技术领域。该方法包括:采集恶意词汇构建恶意词典,并获取URL页面文本信息,对其进行预处理后构建URL页面文本内容数据集;构建融合恶意词典与Bert预训练模型的文本内容检测网络,利用Bert预训练模型对文本进行特征提取,生成包含上下文信息的文本向量;通过恶意值计算模块得到文本序列的恶意权重向量,进而得到文本向量的恶意加权向量;将恶意加权向量经过多尺度卷积模块,提取不同尺度下的特征并生成多尺度特征向量,并计算恶意概率,从而检测恶意URL。本发明显著增强了恶意URL检测的精确度与稳定性,为信息安全提供了更强的防护。
本发明授权一种融合恶意词典与Bert预训练模型的恶意URL检测方法在权利要求书中公布了:1.一种融合恶意词典与Bert预训练模型的恶意URL检测方法,其特征在于:所述方法包括以下步骤: S1:采集恶意词汇构建恶意词典,并获取URL页面文本信息,对其进行预处理后构建URL页面文本内容数据集; S2:构建融合恶意词典与Bert预训练模型的文本内容检测网络,文本内容检测网络包括输入层、Bert预训练模型、恶意值计算模块、多尺度卷积模块以及Softmax分类器; S3:利用Bert预训练模型对文本进行特征提取,生成包含上下文信息的文本向量; S4:通过恶意值计算模块得到文本序列的恶意权重向量,将其与文本向量进行计算得到恶意加权向量;在步骤S4中,恶意值计算模块按照以下步骤计算恶意权重向量: S41、恶意值计算模块首先将预处理后的文本数据进行结巴分词,得到待匹配词集合和待匹配词字数集合: 其中表示第个词语,表示第个词语的字数; S42、将待匹配词和恶意词典中的恶意词通过Word2Vec模型映射为词向量、,计算待匹配词与恶意词之间的相似度,建立恶意词与待匹配词之间的映射关系;恶意词与待匹配词相似度计算公式为: 其中,表示第个词语,表示第个词语,表示与之间的词语相似度;通过相似度计算找到恶意词典中与匹配度最高的词语; S43、定义词恶意值为: 其中,代表在恶意词典中的得分,若大于等于阈值时,则为;反之,则为;其中表示第个词语的字数; 将每个词的恶意值均分到该词中的每个字,字的恶意值表示为: 其中,表示句子中第个字的恶意值,该字属于词语;句子中每个字及标识符[cls]、[sep]的恶意值均被计算,标识符[cls]、[sep]的恶意值默认为1; S44、将上述计算得到的每个字的恶意值构建恶意值向量: 将得到的恶意值向量进行归一化,得到恶意权重向量,对于一个长度为L的句子,其权重向量中的一项为: 最后,将Bert预训练模型输出的文本向量与恶意权重向量相乘得到恶意加权向量为: 其中,为恶意权重向量,为Bert预训练模型输出的文本向量; S5:将恶意加权向量经过多尺度卷积模块,提取不同尺度下的特征并生成多尺度特征向量,并通过Softmax计算恶意概率; S6:使用构建的数据集训练文本内容检测网络,将训练完成后保留参数配置文件,封装成接口供外部调用。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励