Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华中科技大学沈卫明获国家专利权

华中科技大学沈卫明获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华中科技大学申请的专利基于深度强化学习的分布式阻塞流水车间调度方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115330028B

龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210864726.4,技术领域涉及:G06Q10/04;该发明授权基于深度强化学习的分布式阻塞流水车间调度方法及系统是由沈卫明;孙雪颜设计研发完成,并于2022-07-21向国家知识产权局提交的专利申请。

基于深度强化学习的分布式阻塞流水车间调度方法及系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的分布式阻塞流水车间调度方法及系统,属于分布式阻塞流水线调度领域,该方法将一个车间视为一个智能体,每个智能体包括四个深度强化学习网络:Actor、Critic、targetActor和targetCritic,通过对智能体的训练获得Actor的最优网络参数,使得Actor能够对智能体是否接收待调度新工件做出使得所有智能体内所有工件总完成时间偏差最小的最优决策;从而在线决策时,只需对Actor输入智能体的当前观测值,即可输出使得所有智能体内所有工件总完成时间偏差最小的最优决策动作。本发明为基于数据驱动的科学决策,决策效率高,适用于各种加工场景,兼容性强。

本发明授权基于深度强化学习的分布式阻塞流水车间调度方法及系统在权利要求书中公布了:1.一种基于深度强化学习的分布式阻塞流水车间调度智能体训练方法,其特征在于,将一个车间视为一个智能体,每个智能体包括四个深度强化学习网络:Actor、Critic、targetActor和targetCritic,训练目标是获得Actor的最优网络参数,使得Actor能够对智能体是否接收待调度新工件做出使得所有智能体内所有工件总完成时间偏差最小的最优决策,所述完成时间偏差为工件的完成时间减去到期时间的绝对值;对任一智能体A的训练方法包括如下步骤: T1从预先获取的训练集中随机取一组数据s,a,s′,r,其中,s为各智能体的当前观测状态集合,a为各智能体的Actor在当前观测状态下决策的动作集合,s′为各智能体执行a中对应动作后的新的观测状态集合,r为各智能体执行动作a中对应动作后得到的奖励值之和;智能体插入待调度新工件后的其所有工件的总完成时间偏差越小,得到的奖励值越大; T2通过评价函数对在当前观测状态集合s下、智能体A的Actor网络参数θμ下、各智能体执行a中对应动作的调度方案进行评价,得到评价值;评价值越大,说明该调度方案越好; T3采用梯度上升方法对智能体A的Actor网络参数θμ进行更新; T4采用深度Q网络的TD误差的梯度下降方法,对智能体A的Critic网络参数θQ进行更新,使智能体A的Critic更接近其targetCritic; T5将步骤T3更新后的Actor网络参数θμ隔代复制给智能体A的targetActor,将步骤T4更新后的Critic网络参数θQ隔代复制给智能体A的targetCritic; T6返回执行步骤T1,直至达到设定的训练次数或步骤T3中梯度收敛; 步骤T1中,s=o1,...,oi,...,on,n为智能体总数,oi为第i个智能体的当前观测状态,oi=bi1,bi2,bi1为第i个智能体内所有工件在当前执行调度方案的总完成时间偏差,bi2为第i个智能体插入待调度新工件后该智能体内所有工件的总完成时间偏差;a=a1,...,ai,...,an,ai为第i个智能体的Actor对待调度新工件决策的动作;s′=o1′,...,oi′,...,on′,oi′为第i个智能体执行动作ai后新的观测状态,oi′=bi1′,bi2′,bi1′为第i个智能体执行动作ai后其所有工件的总完成时间偏差,bi2′为第i个智能体执行动作ai后插入下一个待调度新工件后其所有工件的总完成时间偏差。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。