四川大学李贝贝获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于知识蒸馏框架的网络异常快速检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119783011B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510279089.8,技术领域涉及:G06F18/2433;该发明授权一种基于知识蒸馏框架的网络异常快速检测方法是由李贝贝;刘泽;邵泽瑞;张瑞梅;李佳琦;王昕凯设计研发完成,并于2025-03-11向国家知识产权局提交的专利申请。
本一种基于知识蒸馏框架的网络异常快速检测方法在说明书摘要公布了:本发明属于网络异常检测技术领域,其目的在于提供一种基于知识蒸馏框架的网络异常快速检测方法。本发明可提高检测速度,且解决了知识蒸馏中知识来源单一的问题,检测准确率高。具体地,本发明通过知识蒸馏的方法将参数量大、层数多的教师模型中的知识蒸馏到参数量小、层数少的学生模型中,并使用训练后学生模型进行网络异常检测,较传统的异常检测方案而言,本发明避免了使用参数量较大的深度神经网络进行网络异常检测的问题,检测速度更快;此外,本发明在基于响应的知识蒸馏基础上引入了多学生模型结构,有利于缓解学生模型对教师模型的依赖,解决了知识蒸馏中学生模型知识来源单一的问题,提升了训练后学生模型进行网络异常检测的准确率。
本发明授权一种基于知识蒸馏框架的网络异常快速检测方法在权利要求书中公布了:1.一种基于知识蒸馏框架的网络异常快速检测方法,其特征在于,包括: 获取教师模型和包括多个学生模型的学生模型集合; 获取网络异常检测数据集;其中,所述网络异常检测数据集中包括多个训练样本; 从所述网络异常检测数据集中随机抽取得到训练样本,并将所述训练样本分别输入所述教师模型和所述学生模型集合的各学生模型中,以便分别得到所述教师模型和所述学生模型集合的各学生模型对所述训练样本的预测值; 根据所述教师模型和所述学生模型集合的各学生模型对所述训练样本的预测值,计算得到所述学生模型集合中各学生模型的损失函数值; 根据各学生模型的损失函数值计算得到各学生模型的随机梯度值,并基于各学生模型的随机梯度值分别对所述学生模型集合中各学生模型进行反向传播更新,得到包括多个更新后学生模型的更新后学生模型集合; 将所述学生模型集合更新为更新后学生模型集合,并重新从所述网络异常检测数据集中随机抽取得到训练样本,直到得到的损失函数值小于预设阈值或达到预设的最大迭代次数时,输出最终的更新后学生模型集合; 将最终的更新后学生模型集合作为训练后学生模型集合; 基于所述训练后学生模型集合对目标网络进行网络异常检测处理; 获取教师模型,包括: 获取由多个网络设备生成的网络数据,并采用动态图构建方法,结合深度图卷积网络模型,从所述网络数据中学习各网络设备之间的空间依赖关系,进而构建得到与多个网络设备匹配的空间建模模块;其中,所述网络数据包括各网络设备生成的时间序列数据; 基于各网络设备生成的时间序列数据,提取单个时间序列数据内部的时间依赖关系,生成各网络设备的时间特征表示,进而构建得到与多个网络设备匹配的时间建模模块; 基于所述空间建模模块和所述时间建模模块,生成综合的时空特征表示,进而构建得到与多个网络设备匹配的时空融合模块; 通过所述时空融合模块对所述空间建模模块和所述时间建模模块进行协同训练,进而得到教师模型; 所述采用动态图构建方法,结合深度图卷积网络模型,从所述网络数据中学习各网络设备之间的空间依赖关系,进而构建得到与多个网络设备匹配的空间建模模块,包括: 将所述网络数据输入动态图构建模块中,以便所述动态图构建模块基于深度图卷积网络模型逐层进行图结构更新,进而得到网络设备间的图结构和所述图结构的节点特征; 其中,所述图结构为: AK=DGCXK-1∈Rn×n; 式中,K表示所述深度图卷积网络模型的总层数,K为大于1的自然数,XK-1表示由所述深度图卷积网络模型的第K-1深度图卷积网络层生成的节点特征,DGC·表示所述动态图构n×n建模块中用于确定节点之间是否存在连接关系的函数,Rn×n表示n行n列的矩阵,n为网络设备的总数量; 所述图结构的节点特征为:XK;其中,XK表示由所述深度图卷积网络模型的第K深度图卷积网络层生成的节点特征; 获取所述深度图卷积网络模型的每一深度图卷积网络层的节点特征,并将其组合为节点特征集; 获取投影向量,并根据所述节点特征集和所述投影向量,得到网络设备间隐含的高阶依赖关系; 根据所述高阶依赖关系和所述节点特征集,得到网络设备间深度耦合的空间相关性特征; 根据所述图结构、所述图结构的节点特征和所述空间相关性特征,构建得到与多个网络设备匹配的空间建模模块; 所述由所述深度图卷积网络模型的第k深度图卷积网络层生成的节点特征的表达式为: 式中,k∈{2,3,......,K+1},表示归一化的对称图结构,Ak-1表示所述动态图构建模块计算得到的第k-1图结构,D表示第k-1图结构Ak-1的度矩阵,I表示单位矩阵; 所述节点特征集的表达式为: X=[X0,X1,...,Xk...,XK]∈Rn×K+1×d; 其中,X0表示所述深度图卷积网络模型的预设的初始节点特征,d表示预设的节点特征维度; 所述高阶依赖关系为: 式中,表示所述高阶依赖关系,Reshape·表示用于调整矩阵维度的函数,S表示每个深度图卷积网络层的重要性,S=sigmoidX·c∈Rn×K+1×1,c表示所述投影向量,c∈Rd×1; 所述空间相关性特征为: 式中,Hout表示所述空间相关性特征,⊙表示矩阵乘法符号; 所述基于各网络设备生成的时间序列数据,提取单个时间序列数据内部的时间依赖关系,生成各网络设备的时间特征表示,进而构建得到与多个网络设备匹配的时间建模模块,包括: 将各网络设备生成的时间序列数据分别划分为多个补丁,并将各网络设备的多个补丁投影到高维空间,得到各网络设备的高维时间序列数据; 根据各网络设备的多个补丁,基于自注意力模块分别获取各网络设备的多个新补丁,并分别将各网络设备的新补丁进行组合处理,得到各网络设备的新的网络数据; 对各网络设备的新的网络数据与高维时间序列数据之和进行批量归一化处理,得到各网络设备的初始时间特征表示; 采用前馈神经网络对各网络设备的初始时间特征表示进行增强处理,得到各网络设备的增强后时间特征表示; 将各网络设备的增强后时间特征表示重新投影到所述网络数据的初始维度,得到各网络设备的时间特征表示; 根据各网络设备的时间特征表示,构建得到与多个网络设备匹配的时间建模模块; 任一网络设备的高维时间序列数据表示为: Z=Z'WZ; 式中,Z∈RN×d,Z=z1,z2,...,zi,...,zN,zi表示所述任一网络设备的多个补丁中的第i个d补丁,zi∈Rd,N表示补丁的总数量,d表示预设的节点特征维度,Z'表示所述任一网络设备的多个补丁,Z'∈RN×P,P表示补丁的长度,WZ表示预设的权重矩阵,WZ∈RP×d; 根据任一网络设备的多个补丁,基于自注意力模块获取任一网络设备的新补丁,并将所述任一网络设备的新补丁进行组合处理,得到所述任一网络设备的新的网络数据,包括: 初始化相对位置编码参数Wpos={W1,W2,...,Wj-i,...,WN-1};其中,Wj-i表示所述任一网络设d备的补丁i和补丁j的索引,Wj-i∈Rd; 根据所述相对位置编码参数计算得到所述任一网络设备的各补丁之间的注意力权重以及归一化注意力权重;其中,所述任一网络设备的补丁i和补丁j之间的注意力权重为: 式中,μij为所述任一网络设备的补丁i和补丁j之间的注意力权重,zj表示所述任一网络设备的多个补丁中的第j个补丁,zj∈Rd,βQ和βK表示预设的权重矩阵参数,βQ∈Rd×d,βK∈Rd×d,aij表示所述任一网络设备的补丁i和补丁j的嵌入的关注程度,aij=Wj-i; 所述任一网络设备的补丁i和补丁j之间的归一化注意力权重为: 式中,αij为所述任一网络设备的补丁i和补丁j之间的归一化注意力权重,μie表示所述任一网络设备的补丁i和补丁e之间的注意力权重; 基于所述任一网络设备的多个补丁和各补丁之间的归一化注意力权重,计算得到所述任一网络设备的多个新补丁;其中,与所述任一网络设备的多个补丁中第i个补丁对应的新补丁为: 式中,zi'为所述任一网络设备的多个补丁中第i个补丁对应的新补丁,βV表示预设的权重矩阵参数,βV∈Rd×d; 将所述任一网络设备的多个新补丁进行组合处理,得到所述任一网络设备的新的网络数据;其中,所述任一网络设备的新的网络数据表示为: Zattn=z'1,z'2,…,z'i,…,z'N; 式中,zattn∈RN×d; 所述任一网络设备的初始时间特征表示为: Y=BatchNormZ+zattn; 式中,Y为所述任一网络设备的初始时间特征表示,BatchNorm·为批量归一化函数; 任一网络设备的增强后时间特征表示为: 式中,为任一网络设备的增强后时间特征表示,BatchNorm·为批量归一化函数,表示所述任一网络设备的初始时间特征表示;为任一网络设备的增强时间特征表示,Relu·表示激活函数,W和W表示预设的权重矩阵,b和b分别表示权重矩阵W和W对应的偏置; 所述任一网络设备的时间特征表示为: 式中,为所述任一网络设备的时间特征表示,Y'为对所述任一网络设备的增强后时间特征表示展平得到的特征表示,Y'∈R1×N×d,WLinear表示预设的线性层权重矩阵,WLinear∈RN×d×d; 所述时空特征表示为: G=δstHout; 式中,G为所述时空特征表示,softmax·表示激活函数,Yout表示所述时间建模模块,Hout表示所述空间建模模块中的空间相关性特征,Wtp和Wsp表示预设的权重参数,Wtp∈Rd×d,Wsp∈Rd×d,T表示转置符号,d表示预设的节点特征维度; 任一学生模型的损失函数值采用交叉熵损失函数以及KL散度计算得到; 所述学生模型集合中第i个学生模型的损失函数值为: 式中,Li为所述学生模型集合中第i个学生模型的损失函数值,a、b和c'表示预设的训练权重,K'表示所述学生模型集合中学生模型的总数量,表示第i个学生模型的硬交叉熵损失,表示第i个学生模型的软交叉熵损失,表示第i个学生模型的预测值,表示所述学生模型集合中第k个学生模型的预测值,DKL表示第i个学生模型的KL散度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励