杭州电子科技大学司展宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种基于多元时序流数据的无监督异常检测分析解决方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114492826B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111386406.4,技术领域涉及:G06N20/00;该发明授权一种基于多元时序流数据的无监督异常检测分析解决方法是由司展宇;樊谨;汪森;汪炜杰;孙丹枫;邬惠峰设计研发完成,并于2021-11-22向国家知识产权局提交的专利申请。
本一种基于多元时序流数据的无监督异常检测分析解决方法在说明书摘要公布了:本发明公开了一种基于多元时序流数据的无监督异常检测分析解决方法。本发明分为三个阶段:离线训练阶段,在线部署阶段,智能异常分析阶段。模型通过时间卷积网络和变分自编码器来解构和重构多元时间序列流数据,学习正常模式。在线流数据检测时,封装成块送入模型得到得分和分类标签,并根据提出的“异常反转机制”,解决在线异常检测中的概念漂移问题,并重训练模型,动态更新分类阈值,提高了处理在线流数据异常的准确度。之后,并行或串行的进行维度粒度的智能异常分析,生成不定维度的异常分析报告。本发明能够对多维度的、复杂的检测指标以及飞速增长的数据流进行智能异常识别、检测、分析,流程完善,为系统安全运行提供了保障。
本发明授权一种基于多元时序流数据的无监督异常检测分析解决方法在权利要求书中公布了:1.一种基于多元时序流数据的无监督异常检测分析解决方法,其特征在于该方法的实现包括三个阶段:离线训练阶段、在线检测阶段和智能异常分析阶段;模型利用深度贝叶斯网络捕获多条序列间隐含关系,利用膨胀卷积捕获时间方向上的隐含关系;当流数据过来时自动计算阈值,进行异常分类;并使用异常反转机制捕获概念漂移;之后通过串行或并行分析最可能出现异常的不定数维度,输出它们并可视化; 该方法实现具体如下: 一、离线预训练阶段: 步骤1:将历史正常数据预处理,设定窗口大小,封装成批次,作为无监督训练集; 步骤2:模型训练;用步骤1获取的训练集对整个模型进行训练,获得所需参数W*-s、b*-s、φ-s、θ-s以及训练集的异常得分; 编码器模块中,使用滑动窗口机制,将整个训练集的数据批次化、窗口化;输入的数据表示为{xt-T+i:t+i|b<ie},窗口长度为T+1,批次大小为e-b+1,关注批次中的每一个窗口;接下来,具有若干层的TCN模块捕获输入时间序列的时间依赖模式,输出与输入的xt-T:t维度相同的ht-T:t;然后计算得到ht-T:t的均值向量μz和方差向量σz,通过重参数技术采样得到隐空间向量z0,将z0使用PNF机制通过若干层迭代计算,得到非高斯分布的先验概率分布,整个编码器部分公式如下: 公式1中第一式展示了TCN模块对时间依赖的捕获;第二式和第三式根据h计算高斯分布的均值向量μz和方差向量σz,其中fφh代表ReLU激活函数;第四式根据方差进行采样;均值向量μz来自于线性层,方差向量σz由Soft-Plus激活函数和微小扰动∈生成;第五式和第六式展示了PNF处理隐变量z,z=zK;代表服从均值为μz,方差为σz的高斯分布;uz,Wz,bzandφ代表步骤2中训练好的模型参数;通过编码器模块,最终将会得到潜在空间序列zK t-T:t; 解码器模块pθx|z包括随机卷积神经网络层和VAE层,该过程公式化为: 其中,公式2中一式展示了随机卷积神经网络模块生成隐藏层序列的过程;公式2中二三式与公式1中一二式类似,唯一的不同在于生成的过程;重构序列直接从概率分布probabilitydistribution中生成,而不是从PlanarNF层中生成;同样的参数和θ代表步骤2中训练完成的模型参数; 在该模型的离线训练过程中,对网络参数W*-s、b*-s、φ-s、θ-s通过ELBO优化;在离线训练集中,取窗口大小为T+1的时间序列数据;根据蒙特卡洛算法,将采样长度设为L,第1个样本记为因此能够定义单个损失函数: 其中ht=TCNXt-T:t,TCN为随机卷积神经网络的范式,表示为xt的先验概率服从 代表xt在满足qφzt|ht分布条件下的期望;xt的先验概率服从 公式3的第一项是标准多元高斯正态分布,第二项代表Kullback-LeiblerKL损失,第三项是一个非负的重构误差; 整个训练过程依赖于单个损失函数,表示为: 其中T+1代表窗口大小,代表单个观测实例损失,代表整个窗口下观测数据的总损失; 步骤3:训练好之后,根据训练集数据的重构概率得到训练集的异常得分,此得分将作为POT算法的输入; 对于t时刻的单个重构数据它是由zt从概率中生成;如果在时间t发生异常,那么重构数据将与原始数据xt有差异,因此根据重构数据的重构概率检测当前原始数据xt的异常得分st: 其中,st代表原始数据xt中每个维度的异常分数,logpθ表示重构概率函数,为输入序列xt-T:t的生成概率, 则原始数据xt的异常得分可表示为各维度异常分数的均值,具体如下: 其中,ASt代表观测实例的异常得分,m为维度数,为时间点t的第i个维度的异常得分; 对训练集中每个数据点的异常得分汇总,得到训练集的异常得分Ⅰ,异常得分Ⅰ作为POT算法的输入POTInitScore,以供后续阶段使用; 二、在线检测阶段: 步骤1:将在线无标签流数据预处理,设定窗口大小,封装成Block,作为测试集数据; 步骤2:将测试集数据依次送入模型,得出预测得分; 将测试集数据中的每个Block替代离线阶段步骤3的训练数据集,得到测试集数据中每个Block对应的异常得分Ⅱ,异常得分Ⅰ和异常得分Ⅱ一起作为POT算法的输入,得出一个预测阈值; 步骤3:将每个Block对应的异常得分Ⅱ和预测阈值送入异常反转机制算法中,判断是否为长期异常;如果不是,则输出预测标签;如果是,则进行反馈训练,以应对概念漂移; 步骤4:重复步骤3和4,直至测试集数据中所有Block都处理完成; 使用POT算法设置动态阈值,这是一种专门对极值建模的方法;它选择一个阈值隔离其余数据,超出阈值的值分布类似于具有参数的广义帕累托分布;POT算法输出一个阈值,作为划分异常的标准; 三、异常分析阶段: 步骤1:将POT算法输出的动态变化的预测阈值和在线检测阶段的中间变量预测的每个Block对应的异常得分Ⅱ送入异常分析算法;该异常分析算法基于异常得分Ⅱ对应的预测阈值选取若干个异常维度;异常维度张量输出实现如下:依次判断异常得分Ⅱ中各维度异常得分是否小于预测阈值,如果小于就标记为异常维度,以此选取出不定数维度的异常; 其中,异常分析阶段与在线检测阶段串行时,使用的预测阈值是最终整个测试集的预测阈值,异常得分Ⅱ是中间某一段的异常得分Ⅱ;如果采用并行方式,使用的预测阈值是动态变化的预测阈值在该时刻的值,异常得分Ⅱ是该时刻所处理的数据点对应的异常得分Ⅱ; 步骤2:步骤1中异常分析算法的输出是异常维度张量,且该异常维度张量能够可视化标记在原始数据曲线上。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。