暨南大学郭洪飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉暨南大学申请的专利一种基于双智能体邻域搜索算法的混合流水车间调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120278448B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510351673.X,技术领域涉及:G06Q10/0631;该发明授权一种基于双智能体邻域搜索算法的混合流水车间调度方法是由郭洪飞;李成帅;任亚平;朝宝;何智慧;李建庆设计研发完成,并于2025-03-24向国家知识产权局提交的专利申请。
本一种基于双智能体邻域搜索算法的混合流水车间调度方法在说明书摘要公布了:本发明属于生产调度技术领域,且公开了一种基于双智能体邻域搜索算法的混合流水车间调度方法,具体步骤如下:步骤一:研究混合流水车间的现实生产场景,挖掘约束条件,分析主要影响生产周期的主要调度问题。本发明整合了深度Q网络DQN和元启发式算法的优势,提出了一种双智能体邻域搜索算法,该算法可以迅速响应车间环境的变化并动态调整调度策略,旨在为混合流水车间调度及其衍生问题提供新的高效求解方案;本发明构建了两个能够与车间环境实时交互的智能体:第一个智能体能够确定每个阶段工件的加工顺序,快速生成有前途的初始解决方案;第二个智能体可以选择最优邻域搜索策略,动态调整搜索方向以加速算法的收敛。
本发明授权一种基于双智能体邻域搜索算法的混合流水车间调度方法在权利要求书中公布了:1.一种基于双智能体邻域搜索算法的混合流水车间调度方法,其特征在于,具体步骤如下: 步骤一:研究混合流水车间的现实生产场景,挖掘约束条件,分析主要影响生产周期的调度问题: 在HFSP车间,有个工件需要按顺序通过个处理阶段,每个阶段存在台可选择机器,并且至少有一个阶段满足,,在每个阶段,工件能且只能选择一台机器进行加工,完成当前阶段加工后,任务立即进入后续加工阶段,,所有工件和机器在0时刻都是准备好的,机器在同一时刻只能加工一个工件且加工过程不允许中断,所有工件在每个阶段的加工时间是已知的,并且不考虑工件在前后两个阶段间的运输时间和机器的准备时间,优化目标是最大限度减少生产周期,即获取最小化的最大完工时间,调度任务是确定每个阶段的工件序列和机器分配; 步骤二:根据问题特性,设计编码、解码策略,将解决方案符号化表示: 编码是解决方案的表示方法,混合流水车间调度的任务是确定每个阶段的工件序列和机器分配,采用一个行列的二维矩阵表示解决方案,为阶段数量,为工件数量,在车间有3个阶段,5个工件的情况下,其解决方案表示如下: ; 解码是将解决方案转化为实际的调度方案,针对每个阶段的工件序列,工件在矩阵第行的位置就表示其在第阶段的加工顺序,根据矩阵,第一阶段的工件序列为,即第一阶段工件的加工顺序依次为工件3、工件2,工件1,工件5和工件4,对于机器分配,采用“最先空闲”规则,即优先将工件分配给最先处于空闲状态的机器进行加工,如同时存在多台空闲机器,则随机将其分配给其中一台进行加工; 步骤三:构造基于马尔可夫决策过程的智能体,设计状态空间、动作空间、状态转移、奖励函数和神经网络架构: 基于马尔可夫决策过程构建了2个智能体:和,其中,根据每个决策时刻点待加工工件的特征确定每个阶段的工件序列,从而快速生成初始解决方案,根据当前解下的车间环境选择最优邻域扰动策略,驱动解向着有潜力的方向进化; 步骤四:引入自适应探索机制和动态接收准则来平衡算法的开发和探索能力: 在智能体和训练过程中,为防止智能体始终选择值最高的动作而过度依赖特定的状态-动作组合,从而限制它们对其他策略的探索,影响识别潜在最优解的能力,引入了一种基于策略的自适应探索机制,以平衡智能体的动作选择概率; 在每个决策点,生成一个随机数,如果大于阈值,智能体将选择当前状态下拥有最高Q值的动作,相反,如果小于或等于,智能体将从可选动作中随机选择一个动作,阈值在训练过程中线性变化,,其中表示训练总迭代次数,表示当前训练次数;随着训练的进行,逐渐减小,在鼓励算法多利用已学习到的知识的同时,仍保留探索能力,这种自适应探索机制确保了学习过程的平衡,既促进了最优策略的识别,又鼓励了对新可能性的探索; 为平衡算法的局部搜索能力和全局搜索能力,构建一个动态接受准则,在算法每次迭代结束时,将当前解与最优解进行比较,如果当前解优于最优解,则用当前解更新最优解,并将其作为下次迭代进化的初始解,否则,生成一个随机数; 步骤五:训练智能体,构造双智能体邻域搜索算法: 训练智能体和,它们的参数设置不同,但是训练步骤一致,首先,初始化经验回放缓冲区和奖励缓冲区,构建评估网络和目标网络,,接下来开始循环训练,在每个训练回合,智能体要先重置环境并初始化累积奖励,在每个决策点,智能体基于当前状态选择动作,执行动作使智能体进入下一个状态,计算即时奖励,并将状态转移存储在经验回放缓冲区中,一旦达到预定义的阈值,就从中随机采样一批数据,使用评估网络和目标网络计算值和损失函数,然后,使用Adam优化器最小化,并更新评估网络,在每次训练的最后,计算最近10个回合的平均奖励,并将其与记录的最佳平均奖励进行比较,如果,则保存当前目标网络; 步骤六:生成高效调度方案,实现生产的实时调度和动态调整,并将所提方法与常用方法进行对比,验证所提方法的高效性: 在车间生产过程中,传感器实时监测车间设备、工件和环境数据,并将这些数据反馈给车间调度系统,调度系统根据当前的实时数据进行分析,并提供双智能体邻域搜索算法获取当前车间环境下的最优操作,进而生成最优调度决策方案,随后,车间调度系统执行该决策方案,实现对车间生产的高效调度规划以缩短工件的生产周期; 为了进一步验证基于双智能体邻域搜索算法的调度方法求解混合流水车间调度的高效性,将其与求解此类问题常用的遗传算法GA和迭代贪婪算法IG在100个仿真实例上进行对比。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人暨南大学,其通讯地址为:510000 广东省广州市天河区黄埔大道西601号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励