当前位置 : 首页 > 专利喜报 > 北京理工大学甘明刚获国家专利权

北京理工大学甘明刚获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉北京理工大学申请的专利一种基于数据和模型混合驱动的生产线调度方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116719285B 。

龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310707020.1，技术领域涉及：G05B19/418；该发明授权一种基于数据和模型混合驱动的生产线调度方法是由甘明刚;夏明月;陈杰;王钢;张少卿;朱轶兵;马千兆设计研发完成，并于2023-06-15向国家知识产权局提交的专利申请。

本一种基于数据和模型混合驱动的生产线调度方法在说明书摘要公布了：本发明公开一种基于数据和模型混合驱动的生产线调度方法，首先，根据柔性生产线中资源位置及布局、作业订单数量及种类、随机噪声扰动等要素，构建随机扰动下柔性生产线调度模型；然后，根据数据和模型混合驱动框架，对该调度模型求解；在数据和模型混合驱动框架中，数据驱动指的是基于值分解的多智能体强化学习算法，模型驱动指的是启发式分派规则和经验知识，二者的混合驱动主要体现在三个方面：一是将调度规则用于指导智能体策略选择，二是基于调度场景知识设计奖励函数，三是用历史经验和数据有监督训练噪声检测与去噪模块；最后，在扰动环境下，采用这种数据和模型混合驱动方法进行生产线调度，本发明用于求解随机扰动下的柔性生产调度。

本发明授权一种基于数据和模型混合驱动的生产线调度方法在权利要求书中公布了：1.一种基于数据和模型混合驱动的生产线调度方法，其特征在于，首先，根据柔性生产线中资源位置及布局、作业订单数量及种类、随机噪声扰动的要素，构建随机扰动下柔性生产线调度模型；然后，根据数据和模型混合驱动框架，对该调度模型求解；在数据和模型混合驱动框架中，数据驱动指的是基于值分解的多智能体强化学习算法，模型驱动指的是启发式分派规则和经验知识，二者的混合驱动体现在三个方面：一是将调度规则用于指导智能体策略选择，二是基于调度场景知识设计奖励函数，三是用历史经验和数据有监督训练噪声检测与去噪模块；最后，在扰动环境下，采用这种数据和模型混合驱动方法进行生产线调度；所述方法的步骤包括：步骤1：对随机扰动下柔性生产线调度问题进行建模；步骤2：根据步骤1得到的模型，提出一种求解该模型的数据和模型混合驱动框架；步骤3：根据步骤2提出的数据和模型混合驱动框架，将调度规则用于指导智能体策略选择；步骤4：根据步骤2提出的数据和模型混合驱动框架，基于调度场景知识设计奖励函数；步骤5：根据步骤2提出的数据和模型混合驱动框架，构建基于数据和模型混合驱动的噪声检测与去噪模块；步骤6：在扰动环境下，根据步骤3构建的策略、步骤4设计的奖励函数和步骤5训练好的检测与去噪模块，用这种数据和模型混合驱动方式进行生产线自适应调度；所述的步骤1中，构建随机扰动下柔性生产线调度问题的具体方法为：根据生产线的资源位置及布局、作业订单数量及种类、随机噪声扰动，构建随机扰动下柔性生产线调度模型；定义决策点为某一工序操作结束时、新订单插入时和机器故障时；定义干扰观察出现时，，其中，表示周围所有允许的扰动观测，是预测高斯分布的均值；所述的步骤2中，求解调度模型的数据和模型混合驱动框架，其构建的具体方法为：将知识模型与多智能体强化学习结合，具体来说，数据和模型混合驱动的方式是以强化学习算法为主体，通过三种方式用规则知识作为辅助来提升算法的鲁棒性，三种方式分别为： 1将调度规则用于指导智能体策略选择，设计基于规则的贪心算法； 2基于调度场景知识设计奖励函数，并使用运输距离作为对单个智能体的惩罚； 3构建数据和模型混合驱动的噪声检测与去噪模块，识别生产线扰动；所述的步骤3中，将调度规则用于指导智能体策略选择的具体方法为：在选择优先调度的作业agent时，加入剩余任务量最大MLF和剩余任务量最小LLF两条启发式规则；在选择该作业优先前往的工作站时，加入最短距离优先SDF规则，设计基于规则的贪心算法；所述的步骤4中，基于调度场景知识设计奖励函数为：其中，表示时刻移动作业数，表示时刻等待作业数，表示时刻当前路程时间，表示时刻最大路程时间，表示最大完工时间，表示完成所有订单加工的最大完工时间，、为设定常数；所述的步骤5中，构建基于数据和模型混合驱动的噪声检测与去噪模块的具体方法为：采用变分自编码器结构分别构建检测模块和去噪模块；其中，所述的变分自编码器结构由编码器和解码器两部分组成，编码器从原始信息中提取特征，解码器对提取的特征进行重构；所述的检测模块在解码的观测值与编码的观测值显著不同时报告异常观测值，使用不含噪声扰动的历史数据，通过最小化重构误差来预训练网络；所述的去噪模块将检测模块发现的异常观测数据映射到真实的正常观测：所述的步骤6中，用这种数据和模型混合驱动方法进行生产线调度的具体方法为：在扰动环境下，根据步骤3构建的策略、步骤4设计的奖励函数和步骤5训练好的检测与去噪模块进行生产线自适应调度；首先，载入调度任务，初始化作业和工作站信息，初始化经验回放池和强化学习价值网络参数和策略网络参数；然后，判断待调度作业集合是否为空，如果不为空，则获取当前可选动作，计算当前位置与可选工作站位置之间的距离，以概率基于模型驱动的启发式规则选择动作，以概率选择值最大的动作；接着，执行调度动作并收到环境给予的奖励，从待调度集合中移除当前工序，添加后一道工序；计算调度和加工时间，更新环境状态；重复上述步骤直至待调度作业集合为空，最后，输出调度过程序列及最大完工时间。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人北京理工大学，其通讯地址为：100081 北京市海淀区中关村南大街5号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

北京理工大学甘明刚获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务