Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥工业大学;宣城雪诺制冷设备有限公司周开乐获国家专利权

合肥工业大学;宣城雪诺制冷设备有限公司周开乐获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥工业大学;宣城雪诺制冷设备有限公司申请的专利基于元强化学习的数据中心制冷系统能耗优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120742691B

龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511205665.0,技术领域涉及:G05B13/04;该发明授权基于元强化学习的数据中心制冷系统能耗优化方法及系统是由周开乐;周煜成;张传东;陆信辉;虎蓉;刘萧萧设计研发完成,并于2025-08-27向国家知识产权局提交的专利申请。

基于元强化学习的数据中心制冷系统能耗优化方法及系统在说明书摘要公布了:本发明提供一种基于元强化学习的数据中心制冷系统能耗优化方法及系统,涉及能耗优化领域。本发明中,首先,构建基于数据中心制冷系统运行特性马尔科夫决策过程;其次,采用元强化学习算法构建策略网络,其中针对制冷系统对控制动作连续性与物理可行性的要求,提出引入动作平滑与约束正则化的软演员评论家算法,以执行策略网络的内循环策略更新;最后,利用策略网络对能耗优化进行动态优化控制,在识别到当前任务为新任务时,通过执行内循环策略更新微调述策略网络,以生成相应的最优控制策略。本发明能够在不同运行环境间实现策略的快速迁移与自适应优化。

本发明授权基于元强化学习的数据中心制冷系统能耗优化方法及系统在权利要求书中公布了:1.一种基于元强化学习的数据中心制冷系统能耗优化方法,其特征在于,包括: 基于数据中心制冷系统运行特性,将不同运行环境下数据中心制冷系统的能耗优化任务描述为相应的马尔科夫决策过程; 构建包括多种运行环境下能耗优化任务的任务集合,采用元强化学习算法构建策略网络;其中,通过ASCR-SAC算法引入动作平滑正则化项以及可行性约束正则项,以执行所述策略网络的内循环策略更新; 基于实时的运行环境识别当前任务,并利用所述策略网络生成当前任务的最优控制策略,包括: 若所述任务集合中不存在当前任务或与其相似的任务,则将当前任务作为新任务,通过执行所述内循环策略更新微调所述策略网络,并利用微调后的策略网络生成该新任务的最优控制策略; 所述动作平滑正则化项是指: 其中,为动作平滑惩罚项,用于鼓励连续时刻动作变化平缓;为动作平滑正则化系数;、分别为t时段、t-1时段的动作; 所述可行性约束正则项是指: 其中,为动作范围惩罚项,用于限制动作输出在设备的允许运行范围内;为动作约束正则化系数;为动作的第j维分量;、为动作第j维允许的最大值、最小值; 所述采用元强化学习算法构建策略网络,具体包括: 1内循环策略更新 对于任务集合中任意一个任务m,通过所述ASCR-SAC算法对策略网络进行局部更新,构建如下策略损失函数: 其中,为策略参数;为期望,为任务m的运行数据;为温度参数,控制熵项对于目标值的影响;表示动作采样的对数概率,对应策略熵;min为取较小值,、为两个Q网络,下标、分别为前述两个Q网络的参数; 策略采用梯度下降更新,局部适应更新公式为: 其中,为任务m的适应后策略参数;为内循环学习率;为梯度算子; 2外循环元参数更新 在完成任务集合中所有任务的局部适应更新后,构建如下总元损失函数: 其中,M为任务集合; 对初始的策略参数执行优化更新: 其中,为元学习率。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学;宣城雪诺制冷设备有限公司,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。