大连理工大学金傲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利一种面向精细化工生产过程的异常检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117113250B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311019903.X,技术领域涉及:G06F18/2433;该发明授权一种面向精细化工生产过程的异常检测方法是由金傲;杨鑫;魏小鹏;朱理;朱建民;孔凡志设计研发完成,并于2023-08-14向国家知识产权局提交的专利申请。
本一种面向精细化工生产过程的异常检测方法在说明书摘要公布了:本发明属于计算机与化工交叉学科多监测点监控中的异常检测领域,提出一种面向精细化工生产过程的异常检测方法,异常识别智能体模型于数据集中进行随机采样并获取当前状态,异常识别智能体模型根据当前状态给出动作;强化学习训练环境根据数据集返回最为异常的下一时刻状态,并将下一时刻状态作为异常识别智能体模型下一个时间步的输入;强化学习训练环境根据异常识别智能体模型对于数据的判断情况给予对应奖励;异常识别智能体模型根据神经元进行网络权重的学习,得到最优网络权重的异常识别智能体模型,用于异常检测。本发明方法首个通过将脉冲神经网络与深度强化学习相结合,以完成化工生产场景下的异常检测任务,检测功耗低,使用场景广泛。
本发明授权一种面向精细化工生产过程的异常检测方法在权利要求书中公布了:1.一种面向精细化工生产过程的异常检测方法,其特征在于,构建数据集、强化学习训练环境和异常识别智能体模型;异常识别智能体模型于数据集中首次进行随机采样并获取当前状态,异常识别智能体模型根据当前状态给出动作;强化学习训练环境根据数据集返回最为异常的下一时刻状态,并将下一时刻状态作为异常识别智能体模型下一个时间步的输入;强化学习训练环境根据异常识别智能体模型t时刻对于数据的判断情况给予对应奖励;在每个时间步t中,异常识别智能体模型根据LIF神经元、IF神经元进行网络权重的学习,所述LIF神经元、IF神经元作为激活函数,得到最优网络权重的异常识别智能体模型,用于异常检测; 所述强化学习训练环境基于现有算法DQN改进奖励函数和采样函数; 所述改进的采样函数为多角度异常偏差采样函数;多角度异常偏差采样函数定义为: ; 其中,表示在带标记的异常数据集中的随机采样函数,表示分别从和中采样的概率;表示下一时刻的状态;表示寻找中潜在异常状态的异常偏置函数、为余弦相似度算法计算的异常分数;表示正交化之后当前状态s与数据集中其他状态之间的距离,分别表示对当前数据集计算时,异常分数最高的潜在异常;表示异常分数最高的潜在异常之间的交集,异常分数函数、是通过将数据集输入到两种经典的无监督算法LOF、iForest,通过无监督算法的检测结果得到的; 将归一化余弦相似度算法的异常分数、LOF算法的异常分数和隔离森林算法的异常分数组合,根据组合分数度量数据集的潜在异常;对于每种算法,计算异常分数最多的前五种异常状态及其相应分数、、;异常状态与对应分数组合成最终的状态空间集合;交叉三种状态空间,当交集不为空,则选择异常分数总和最大的状态为强化学习训练环境的状态信息,否则,选择归一化余弦相似度算法中异常分数最高的状态作为强化学习训练环境的状态信息; 所述改进奖励函数同时考虑外部奖励和内部奖励;外部奖励函数针对带标记的异常数据集设计,内部奖励函数针对未标记数据集设计;对于内在奖励函数,引入无监督算法COPOD,并通过无监督算法的检测结果给定奖励;改进奖励函数定义为: ; 为阈值,分配给异常识别智能体模型每个动作的外部奖励取决于其当前状态和动作; 所述异常识别智能体模型构建过程如下; 基于脉冲神经网络构建异常识别智能体模型ADSD;智能体目标为在设定的强化学习训练环境设置下寻找最优的执行动作,以最大化任务特定奖励;异常识别智能体模型ADSD包括一层输入层、一层全连接层和一层输出层,其中: 输入层接收来自强化学习训练环境的状态信息;输入层包括IF神经元; IF神经元作为编码器,接收数据集中的标准数据格式输入,当输入信号总量超过阈值,IF神经元产生单个时序脉冲输出信号,IF神经元的数学模型表示为: ; 表示输入信号的权重,表示输入信号的大小,表示阈值; 全连接层接收来自输入层的时序脉冲输出信号;将LIF神经元作为全连接层的激活函数,当一个LIF神经元接收其他神经元的时序脉冲输出脉冲时,根据当前的神经网络连接结构对时序脉冲信号进行积累产生膜电位,LIF神经元通过一个随时间衰减的函数,使膜电位随时间逐渐下降并最终回到静息电位;LIF神经元的形式定义如下: ; 代表膜电位,代表静息电位,代表神经元接收到的时序脉冲输出信号,代表膜电阻,代表膜电容; 输出层输出动作价值函数Q得到当前时刻下的动作,并输入至强化学习训练环境中;所述动作价值函数Q和损失函数与现有算法DQN保持一致,具体表现为: ;其中表示在状态下采取行动后按照最优策略得到,表示在时间步长t下获得的即时奖励,为折现因子0 1,损失函数评价当前动作价值函数Q参数的性能;为经验重播缓冲区中的状态行为分布,为环境的经验重播缓冲区;通过获得最优的动作价值函数Q,最终得到最优决策; 所述数据集的构建过程如下; 捕捉化工生产过程个传感器之间的延迟行为、非线性行为,将个传感器的行为信息映射到存储介质中形成历史数据,对其中一部分的异常数据进行人工标记,将数据转换为表格型的标准化数据集,其中被分成为带标记的异常数据集和未标记数据集,。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励