中国地质大学(武汉)胡成玉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国地质大学(武汉)申请的专利一种基于安全强化学习的增材制造车间调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119849842B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411948451.8,技术领域涉及:G06Q10/0631;该发明授权一种基于安全强化学习的增材制造车间调度方法是由胡成玉;李思影;卢超;颜雪松;龚文引设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。
本一种基于安全强化学习的增材制造车间调度方法在说明书摘要公布了:本发明提供一种基于安全强化学习的增材制造车间调度方法,涉及深度学习技术领域,包括:基于车间仿真环境参数确定车间状态向量S,;其中,T表示当前时间,L表示当前批次中正在处理的任务数量,Tard表示所有任务的总拖期时间,C表示已完成任务的总完工时间,Index表示当前正在调度的任务;利用DQN算法,结合车间状态向量S和奖励函数确定待调度任务的优先级,基于所述优先级确定待调度任务的批次;利用改进A3C算法进行机器选择,将不同批次的所述待调度任务分配至目标机器;改进A3C算法为加入了安全盾牌机制的A3C算法。通过综合考虑任务紧急度、加工时间及机器负载,动态优化生产调度,提高了调度效率与资源利用率,实现了多目标平衡。
本发明授权一种基于安全强化学习的增材制造车间调度方法在权利要求书中公布了:1.一种基于安全强化学习的增材制造车间调度方法,其特征在于,包括: 基于车间仿真环境参数确定车间状态向量S,S={T,L,Tard,C,Index};其中,T表示当前时间,L表示当前批次中正在处理的任务数量,Tard表示所有任务的总拖期时间,C表示已完成任务的总完工时间,Index表示当前正在调度的任务; 利用DQN算法,结合车间状态向量S和奖励函数确定待调度任务的优先级,基于所述优先级确定待调度任务的批次; 利用深度Q网络算法,结合所述车间状态向量S和奖励函数将待调度任务划为不同批次的子任务,包括: 利用深度Q网络算法预测每一个调度动作的Q值,对于每个所述车间状态向量S,深度Q网络输出一个动作A,并根据以下公式选择Q值最大的动作: A*=argmaxQS,A; 其中,A表示所有可能动作的集合,A*表示最优动作,A对应着五个不同的调度规则,A={0,1,2,3,4},对应的调度规则分别是:紧急度优先批处理规则、最短加工时间批处理规则、作业负载平衡批处理规则、多目标权衡的实时优先级规则、基于剩余时间与紧急度加权的自适应调度规则; 所述奖励函数的公式为: R=-α·Tard+β·Load+γ·changeCostt+η·isSafe; 其中,Tard表示所有任务的总拖期时间,Load表示机器的负载量,changeCost表示不同任务之间的材料切换成本,isSafe表示当前动作是否安全,a表示当前选择的行动,ASafe表示不安全动作集合,α,β,γ,η是调节系数,用于控制拖期时间、设备负载、材料切换和行动安全性对总奖励的影响; 利用改进A3C算法进行机器选择,将不同批次的所述待调度任务分配至目标机器;所述改进A3C算法为加入了安全盾牌机制的A3C算法; 在利用改进A3C算法进行机器选择,将不同批次的所述待调度任务分配至目标机器之前,还包括: 基于安全盾牌机制对所述A3C算法进行优化,确保机器的负载不超过最大允许负载,确保材料切换次数不超过最大允许切换数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国地质大学(武汉),其通讯地址为:430000 湖北省武汉市洪山区鲁磨路388号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励