中国大唐集团科技创新有限公司;清华大学李同辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国大唐集团科技创新有限公司;清华大学申请的专利一种基于强化学习的惯量飞轮控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119596767B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411625956.0,技术领域涉及:G05B19/042;该发明授权一种基于强化学习的惯量飞轮控制方法及系统是由李同辉;姜新建;孙坤元;倪泽龙;唐宏芬;张宏博;高大伟;王丽杰;刘帅伟设计研发完成,并于2024-11-14向国家知识产权局提交的专利申请。
本一种基于强化学习的惯量飞轮控制方法及系统在说明书摘要公布了:本申请公开了一种基于强化学习的惯量飞轮控制方法及系统,所述方法包括:将经过交互仿真环境和神经网络得到的转换经验多元组存储至经验池中,从当前时刻的经验池中随机采样的设定数量的经验多元组以更新神经网络;根据当前经验池中的奖励判断是否满足神经网络更新结束条件,若满足则将更新后的神经网络作为训练完成的神经网络,否则继续更新神经网络直至满足结束条件;将需要进行控制量计算的惯量飞轮输出端的状态量输入至训练完成的神经网络获取动作,基于动作和转矩设定值获取待输入至惯量飞轮的控制量。利用本申请的方案,能够使得神经网络能够根据实际表现调整其策略,更准确地预测和计算惯量飞轮输出端的状态量对应的动作。
本发明授权一种基于强化学习的惯量飞轮控制方法及系统在权利要求书中公布了:1.一种基于强化学习的惯量飞轮控制方法,其特征在于,包括: 将经过交互仿真环境和神经网络得到的转换经验多元组st,at,rt,st+1存储至经验池中,从当前时刻的经验池中随机采样的设定数量的经验多元组以更新神经网络,其中,st为惯量飞轮输出端当前时刻t的状态量,at为当前时刻t的状态量对应的动作,rt为当前时刻t的奖励,st+1为下一时刻的动作; 根据当前时刻的经验池中所有经验多元组中的奖励判断是否满足神经网络更新结束条件; 响应于满足所述神经网络更新结束条件,将更新后的所述神经网络作为训练完成的神经网络;以及 响应于未满足所述神经网络更新结束条件,返回至更新神经网络的步骤,直至满足神经网络更新结束条件,将最后一次执行更新神经网络的步骤更新的神经网络作为训练完成的神经网络; 将需要进行控制量计算的惯量飞轮输出端的状态量输入至训练完成的神经网络获取动作,基于动作和转矩设定值获取待输入至惯量飞轮的控制量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国大唐集团科技创新有限公司;清华大学,其通讯地址为:071700 河北省自由贸易试验区雄安片区保津高速南段会议中心2-032;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励