北京长亭科技有限公司张璇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京长亭科技有限公司申请的专利基于不平衡多示例学习的异常数据流分类检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120017419B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510472665.0,技术领域涉及:H04L9/40;该发明授权基于不平衡多示例学习的异常数据流分类检测方法及装置是由张璇;樊一博;杨坤;刘美麟;王陶然;王刚;朱文雷;刘金钊;徐鹏志;崔勤;姚可;张嘉欢设计研发完成,并于2025-04-16向国家知识产权局提交的专利申请。
本基于不平衡多示例学习的异常数据流分类检测方法及装置在说明书摘要公布了:本发明公开了一种基于不平衡多示例学习的异常数据流分类检测方法及装置,涉及网络安全技术领域。方法包括:将网络流量划分为正包集合和负包集合;对正包集合中的所有正包进行过采样操作,得到扩充后的新的正包集合;对负包集合中的所有负包进行欠采样操作,得到缩减后的新的负包集合;基于成本权重和类别权重构建代价敏感损失函数;根据代价敏感损失函数构建分类器;对分类器进行训练,根据每一轮训练的漏报数和误报数,更新分类器的成本权重;用优化后的分类器对网络流量进行识别。本发明能够高效且准确地检测网络流量中的异常数据流。
本发明授权基于不平衡多示例学习的异常数据流分类检测方法及装置在权利要求书中公布了:1.一种基于不平衡多示例学习的异常数据流分类检测方法,其特征在于,包括如下步骤: 将网络流量划分为正包集合和负包集合;其中,所述正包集合包括多个正包,所述正包为存在至少一个异常数据包的数据流,所述负包集合包括多个负包,所述负包为全部是正常数据包的数据流,所述正包和负包均含有多个示例,每个示例对应一个数据包; 对正包集合中的所有正包进行过采样操作,以扩充每个正包中的示例,得到扩充后的新的正包集合; 对负包集合中的所有负包进行欠采样操作,以缩减每个负包中的示例,得到缩减后的新的负包集合; 基于成本权重和类别权重构建神经网络模型的代价敏感损失函数;其中,成本权重表示异常数据流被误判为正常数据流的代价,类别权重表示标签是正包或负包时的权重;所述代价敏感损失函数表示为: ; ; ; 其中,为成本矩阵;表示真实标签为负包,预测标签也为负包的代价;表示正常数据流被误判为异常数据流的代价;表示成本权重;表示真实标签为正包,预测标签也为正包的代价;N表示正包和负包的总数量;为交叉熵损失;为神经网络权重;为控制正则化强度的参数;表示真实标签;表示预测标签;表示类别权重;表示扩充后的新的正包集合中正包的数量;表示缩减后的新的负包集合中负包的数量;表示包级别预测概率;表示每个包;表示示例级别分类器;表示第i个包中的第j个示例;表示取包中所有示例的最大值;表示真实标签为正包时;表示真实标签为负包时; 根据所述代价敏感损失函数构建神经网络模型线性分类器,所述神经网络模型线性分类器用于判别网络流量数据流是正包还是负包;所述神经网络模型线性分类器通过下式表示: ; ; 其中,为神经网络模型线性分类器;为每个包的统计核映射向量;表示每个包;为权重向量;b为偏置项;为示例的第维特征,;若,则判定为正包,否则判定为负包; 对所述神经网络模型线性分类器进行训练,统计当前漏报数和误报数;根据下式更新成本权重,以实现自适应的代价敏感学习,直至达到优化目标: 其中,表示更新后的成本权重,表示更新前的成本权重,表示学习率,表示防止除零的参数; 所述优化目标满足如下条件: 其中,为成本矩阵;N表示正包和负包的总数量;为交叉熵损失;为神经网络权重;为控制正则化强度的参数;表示真实标签;表示预测标签;表示类别权重;为神经网络模型线性分类器;表示每个包; 用优化后的神经网络模型线性分类器对网络流量进行识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京长亭科技有限公司,其通讯地址为:100101 北京市朝阳区天辰东路7号楼-2至8层101内北区6层602室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。