浙江大学王雅菲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于安全强化学习的云资源动态调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119576557B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411655809.8,技术领域涉及:G06F9/50;该发明授权一种基于安全强化学习的云资源动态调度方法是由王雅菲;潘伟航;林彬彬;何晓飞;蔡登设计研发完成,并于2024-11-19向国家知识产权局提交的专利申请。
本一种基于安全强化学习的云资源动态调度方法在说明书摘要公布了:本发明公开了一种基于安全强化学习的云资源动态调度方法,包括:将每个应用需求抽象为一个有向无环图,每一个作业阶段用节点表示,每一条边表示作业阶段之间的数据依赖;将计算资源的动态调度问题建模为马尔科夫决策过程,构建强化学习策略模型,定义状态、动作和奖励;强化学习策略模型包含图神经网络和决策网络,决策网络接收图神经网络的输出,并生成选择调度的任务节点和资源分配上限;以奖励最大化为目标对强化学习策略模型进行训练;训练完成后,对于当前时间步,结合实时获取的计算集群的状态,按顺序计算每一个决策步要调度的任务节点和实际分配的计算资源。利用本发明,可以实现更高效的资源调度,提高了计算资源的利用效率。
本发明授权一种基于安全强化学习的云资源动态调度方法在权利要求书中公布了:1.一种基于安全强化学习的云资源动态调度方法,其特征在于,包括以下步骤: 1将每个应用需求抽象为一个有向无环图,每一个作业阶段用有向无环图中的一个节点表示,每一个作业阶段都包含多个并行运算的任务,每一条边表示作业阶段之间的数据依赖; 2将计算资源的动态调度问题建模为马尔科夫决策过程,构建强化学习策略模型,定义强化学习策略模型的状态、动作和奖励; 其中,强化学习策略模型包含图神经网络和决策网络,图神经网络接收观测状态,并负责聚合有向无环图信息;决策网络接收图神经网络的输出,并生成选择调度的任务节点和资源分配上限,决策网络生成的两部分信息进行约束矫正后作为动作输出;最终使得基于策略和可行性约束进行结合以进行实际的资源分配; 决策网络包含节点打分网络和分配计算资源数量打分网络; 节点打分网络中,对于作业i中的节点v,其得分qiv由以下公式计算: qiv≈qeiv,yi,z 其中,eiv是节点的嵌入向量,yi是作业级的嵌入,z是全局嵌入,q是一个非线性变换函数,用于映射嵌入向量到一个标量值,表示该节点的优先级; 分配计算资源数量打分网络中,对于作业i,资源数量的得分wli由以下公式计算: wli≈wyi,z,l 其中,l是为作业i指定的并行度限制,w也是一个非线性变换函数,它基于作业和全局嵌入以及并行度限制来生成得分; 3以奖励最大化为目标对强化学习策略模型进行训练; 4强化学习策略模型训练完成后,对于当前时间步,结合实时获取的计算集群的状态,按顺序计算每一个决策步要调度的任务节点和实际分配的计算资源。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励