三峡大学杨楠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉三峡大学申请的专利一种基于深度强化学习的机组组合智能求解算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115563871B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211234652.2,技术领域涉及:G06F30/27;该发明授权一种基于深度强化学习的机组组合智能求解算法是由杨楠;郝俊聪;杨聪;贾俊杰;叶迪;邾玢鑫;张磊;李振华;王灿;黄悦华;周君;张志;许丹;陈道君设计研发完成,并于2022-10-10向国家知识产权局提交的专利申请。
本一种基于深度强化学习的机组组合智能求解算法在说明书摘要公布了:一种基于深度强化学习的机组组合智能求解算法,它包括以下步骤:步骤1:进行面向机组组合的马尔科夫决策过程MDP建模;步骤2:进行马尔科夫决策过程MDP模型的求解;步骤3:进行基于策略梯度算法的MDP模型求解;步骤4:通过Lambda迭代求解机组实际功率输出方案;通过步骤1至步骤4获得基于深度强化学习的机组组合智能求解算法。本发明的目的是为了解决现有用于UC决策领域的基于深度学习构建的传统模型适应性不强、决策精度不高的技术问题,而提供的一种基于深度强化学习的机组组合智能求解算法。
本发明授权一种基于深度强化学习的机组组合智能求解算法在权利要求书中公布了:1.一种基于深度强化学习的机组组合智能求解方法,其特征在于,它包括以下步骤: 步骤1:进行面向机组组合的马尔科夫决策过程MDP建模; 步骤2:进行马尔科夫决策过程MDP模型的求解; 步骤3:进行基于策略梯度算法的MDP模型求解; 步骤4:通过Lambda迭代求解机组实际功率输出方案; 通过步骤1至步骤4获得基于深度强化学习的机组组合智能求解方法; 在步骤1中,在进行马尔科夫决策过程MDP建模时,分别设置状态空间、动作空间、转移函数、奖励函数; 1-1:设置状态空间,根据给定的输入机组启动停止时间和负荷数据给出对应时刻的机组启停状态,构成状态空间;其数学表达式为: 1; 式中:,其中,表示机组启动停止时间的集合;表示负荷需求数据; 1-2:设置动作空间,在任意时刻,假设系统中包含台机组,则每台机组可能的动作为启动或停止,动作空间是所有机组启动停机动作的组合; 在任意时刻,每台机组可能的动作为启动或停止,动作空间为所有机组启动或停机动作的组合,其动作空间的大小为;将其表示为一个二进制的数组,即 2; 式中:表示所有机组启动或停机动作空间的集合;表示机组的启停动作状态;当机组的动作为启动时,;当机组的动作为停止时,;但是该动作需遵守机组的最小启动停机时间约束;表示系统中所有机组的数目; 1-3:设置转移函数,当MDP模型根据观测到的状态信息决策出机组启停方案并得到奖励值后,转移函数会在满足各约束的条件下根据机组启停动作从状态转至状态,前后有关联的状态信息为机组的连续启动停机时间; 其连续启动停机时间的转换函数为: 3; 式中:表示机组在时刻的连续启动停机时间的转换函数;表示机组在时刻的连续启动停机时间的转换函数;表示每台机组可能的动作为启动或停止,当机组的动作为启动时,,当机组的动作为停止时,; 1-4:设置奖励函数,强化学习RL的目标是让MDP模型求解机组组合UC问题时,在机组启停动作路径上获得的奖励最大化;目标设为最小化系统的总运行成本; 表达式为: 4; 其中 5; 式中:为t时刻系统的运行成本;为t时刻违背运行约束的惩罚值;表示系统中所有机组的数目;为机组的有功出力数值;为机组的启动成本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人三峡大学,其通讯地址为:443002 湖北省宜昌市西陵区大学路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励