华南理工大学孟峻霆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于深度强化学习的运输约束下作业车间调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119472529B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411470690.7,技术领域涉及:G05B19/418;该发明授权一种基于深度强化学习的运输约束下作业车间调度方法是由孟峻霆;姚锡凡;谢廷博;江镇洪设计研发完成,并于2024-10-21向国家知识产权局提交的专利申请。
本一种基于深度强化学习的运输约束下作业车间调度方法在说明书摘要公布了:本发明公开了一种基于深度强化学习的运输约束下作业车间调度方法,包括以下步骤:获取车间调度环境数据以及车间调度订单特征数据,构建训练数据集;基于运输约束下的作业车间调度状态,构建深度强化学习模型;所述深度强化学习模型包括马尔可夫过程和调度器;根据训练数据集,利用多智能体近端策略优化算法训练深度强化学习模型;将车间调度任务输入训练后的深度强化学习模型中,输出调度结果。本发明能够快速有效地找到车间调度问题的较优解,提高了调度的效率和质量。本发明可广泛应用于工业调度技术领域。
本发明授权一种基于深度强化学习的运输约束下作业车间调度方法在权利要求书中公布了:1.一种基于深度强化学习的运输约束下作业车间调度方法,其特征在于,包括以下步骤: 获取车间调度环境数据以及车间调度订单特征数据,构建训练数据集; 基于运输约束下的作业车间调度状态,构建深度强化学习模型;所述深度强化学习模型包括马尔可夫过程和调度器; 根据训练数据集,利用多智能体近端策略优化算法训练深度强化学习模型; 将车间调度任务输入训练后的深度强化学习模型中,输出调度结果; 所述调度器包括一个用于执行工序调度操作的工序调度器、一个用于执行AGV调度操作的AGV调度器,以及一个用于计算状态价值函数的评估网络; 所述工序调度器包括析取图神经网络特征提取模块和工序选择模块; 所述析取图神经网络特征提取模块用于以所述析取图结构和所述析取图原始特征向量作为输入,通过图池化、多层感知机处理计算,得到析取图节点嵌入向量; 所述工序选择模块用于提取候选工序的特征向量,并与所述析取图节点嵌入向量融合后输入工序Actor神经网络,得到每个候选工序的选择概率分布; 所述AGV调度器包括异构图神经网络特征提取模块和AGV选择模块; 所述异构图神经网络特征提取模块用于以所述异构图结构和所述异构图原始特征向量作为输入,通过图注意力网络、多层感知机处理计算,得到异构图中AGV节点嵌入向量;所述AGV选择模块用于将所述异构图中AGV节点嵌入向量输入AGVActor神经网络,得到每个候选AGV的选择概率分布; 所述评估网络用于将所述析取图节点嵌入向量和异构图中AGV节点嵌入向量输入Critics网络,得到状态价值函数值vs; 所述通过图注意力网络、多层感知机处理计算,得到异构图中AGV节点嵌入向量,包括: 定义3个可学习的参数矩阵W1、W2、W3和参数向量a; 计算融合特征: hijk=[W1bk||W2μij||W3λijk] 式中,[||]是矩阵合并运算; 计算异构图中节点的注意力分数: αijk=SoftmaxLeakyReLUaThijk 式中,LeakyReLU是激活函数,Softmax是将所有注意力分数视作矩阵的元素,做归一化运算;T为转置; 根据异构图得到异构图邻接矩阵Ah; 结合所述异构图邻接矩阵将注意力分数进行屏蔽处理,然后融合节点特征得到所述AGV节点嵌入向量: 所述AGV节点嵌入向量经过多层图池化、多层感知机处理计算后得到异构图中AGV节点嵌入向量: 式中,MLP为多层感知机,θ2为多层感知机的参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510641 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励