Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 青岛理工大学房晓雪获国家专利权

青岛理工大学房晓雪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉青岛理工大学申请的专利基于边缘-中心混合优化多智能体强化学习故障诊断方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120804844B

龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511307963.0,技术领域涉及:G06F18/241;该发明授权基于边缘-中心混合优化多智能体强化学习故障诊断方法是由房晓雪;熊晓芸;李厚贇设计研发完成,并于2025-09-15向国家知识产权局提交的专利申请。

基于边缘-中心混合优化多智能体强化学习故障诊断方法在说明书摘要公布了:本申请涉及计算机技术领域,公开了一种基于边缘‑中心混合优化多智能体强化学习故障诊断方法,方法包括以下步骤:S1、采集设备数据并预处理;S2、分层故障诊断:智能诊断智能体采用分层强化学习结构,由高层策略网络与低层策略网络组成;S3、边缘‑中心混合优化:中心策略优化智能体设计并分阶段训练高层策略网络与低层策略网络,采用教师‑学生策略结构对训练好的策略网络进行压缩与蒸馏;基于接收到的策略执行信息执行策略融合与全局更新;S4、策略迁移。本申请在故障样本极度稀缺场景下持续学习与策略更新,利用多智能体协同机制实现诊断知识共享、策略的同步与跨设备迁移,支持在边缘设备端高效部署与运行,并实时适应现场状态变化。

本发明授权基于边缘-中心混合优化多智能体强化学习故障诊断方法在权利要求书中公布了:1.基于边缘-中心混合优化多智能体强化学习故障诊断方法,其特征在于,包括以下步骤: S1、采集设备数据并预处理: 至少构建一个环境感知智能体,用于获取工业制造现场的多模态传感器数据,并将多模态传感器数据标准化成状态向量; S2、分层故障诊断: 至少构建一个智能诊断智能体,接收来自所述环境感知智能体生成的状态表示向量;所述智能诊断智能体采用分层强化学习结构,由高层策略网络与低层策略网络组成,分别处理“故障阶段判断与维护目标生成”与“具体响应动作执行”两类子任务;所述智能诊断智能体记录策略执行信息,并发送给策略优化智能体,用于后续模型训练与策略优化; 所述高层策略网络负责接收来自环境感知智能体的状态向量St,输出当前工况下的中间维护目标gt∈G,低层策略网络接收状态向量St与中间维护目标gt拼接后的输入向量生成具体执行动作at∈A,以实现对工业设备的控制响应,并接收生成的状态转移向量St+1计算动作奖励信息rat,所述高层策略网络根据状态转移St+1计算动作累积奖励rgt; 中间维护目标空间G参考维护指令库中定义的语义目标,动作空间A依据维护指令库中定义的原子操作模板,以确保策略输出具备设备适配性; S3、边缘-中心混合优化: 至少构建一个中心策略优化智能体与边缘策略优化智能体,分别部署在云端服务器与现场边缘设备;所述中心策略优化智能体设计并分阶段训练高层策略网络与低层策略网络,采用教师-学生策略结构对训练好的策略网络进行压缩与蒸馏;基于接收到的策略执行信息执行策略融合与全局更新; 所述策略执行信息包括策略执行记录与策略摘要,S3中所述中心策略优化智能体基于接收到的策略执行信息执行策略融合与全局更新,包括: 各边缘计算节点定期向中心控制节点上传策略执行记录与策略摘要,中心策略优化智能体基于策略执行记录与策略摘要构建全局奖励函数Rglobal,综合考虑设备诊断准确率、响应效率和维护成本,通过集中式强化学习算法PPO更新全局策略参数更新后的策略将作为迭代起点,下发至策略迁移智能体进行新一轮适配部署; 边缘策略优化智能体部署在边缘计算节点,配合智能诊断智能体实现推理模型的轻量化局部优化与策略快速自适应,具体包括: 策略参数加载与推理支持:边缘计算节点接收来自策略迁移智能体下发的适配后的全局策略参数其中与分别为经过策略迁移智能体适配后的高层模型全局参数与低层模型全局参数,加载至智能诊断智能体中供推理调用,边缘策略优化智能体负责模型版本管理、热更新与一致性校验; 实时反馈采集与增量优化:边缘计算节点接收来自智能诊断智能体的策略执行记录,构建本地奖励值Rlocal,利用增量式强化学习算法,对局部策略参数θ′local进行微调和自适应优化,生成局部策略参数θ′local,提升故障响应灵敏度与个体化适配能力; 策略摘要生成与上报:优化过程中,边缘计算节点定期生成策略摘要,将其打包上传至控制中心节点; S4、策略迁移: 至少构建一个策略迁移智能体,用于模型结构压缩与部署优化,以满足目标边缘设备的资源约束与推理要求,所述策略迁移智能体接收来自中心策略优化智能体蒸馏完成后的轻量学生模型参数,执行针对目标设备的部署结构适配,生成部署包并下发至目标设备所在的边缘计算节点,由边缘策略优化智能体进行模型的部署; S4中还包括执行迁移过程控制与环境再学习的步骤,具体是: 在部署后的策略运行阶段,当边缘策略优化智能体发现策略性能下降时,生成策略退化报告并回传至策略迁移智能体; 策略迁移智能体判断是否触发全局训练流程,若是,则设置全局训练模式,将目标模型标识、异常指标和微量数据样本发送至中心策略优化智能体,执行全局训练; 新的策略网络训练完成后取消全局训练模式,重新由策略迁移智能体适配并下发至边缘计算节点,实现跨设备迁移的自闭环再学习能力。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人青岛理工大学,其通讯地址为:266033 山东省青岛市市北区抚顺路11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。