恭喜哈尔滨工业大学;哈尔滨工业大学(深圳)张子阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜哈尔滨工业大学;哈尔滨工业大学(深圳)申请的专利一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115827239B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211603470.8,技术领域涉及:G06F9/50;该发明授权一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法及系统是由张子阳;李欢;赵阳;李峰;林昌垚;刘劼设计研发完成,并于2022-12-13向国家知识产权局提交的专利申请。
本一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法及系统在说明书摘要公布了:本发明提出了一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法及系统,首先建立边缘设备能耗最小化模型;然后构建基于DVFS的边云协同推理框架,以联合优化边缘设备的能耗和端到端延迟;再构建基于DRL的增强型DVFS优化算法DVFO,通过联合优化边缘设备的计算频率和特征图的卸载比例来减少边缘设备的整体能耗;最后建立卸载机制,以解决特征图的卸载瓶颈问题,避免特征图的大小直接影响边云协同推理的端到端延迟;本发明用于云边协同推理中的DNN特征图卸载,使用“边移动边思考”并发策略的强化学习算法为每个任务计算特征图的最佳卸载比和边缘设备的计算频率,以最小化边缘设备的能耗。
本发明授权一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法及系统在权利要求书中公布了:1.一种基于深度强化学习的动态频率和深度学习模型卸载联合调节方法,其特征在于:所述方法具体包括以下步骤:步骤1,建立边缘设备能耗最小化模型;在步骤1中,设为N个独立和非抢占式任务组成的任务集合,表示为;任务的边缘设备整体能耗;其中为计算能耗,为卸载能耗;任务的计算能耗取决于边缘设备的本地计算时间和计算功率,表示为=,其中正比于电压的平方和计算频率,即,;CPU的频率为,GPU的频率为,内存的频率为,则计算频率;任务的卸载功耗与网络带宽、卸载特征图的大小以及卸载功率有关,记为,同样地,;则最小化边缘设备整体的能量消耗,同时满足系统运行的最小频率: (1) 其中,表示为任务的端到端延迟;步骤2,基于步骤1建立的边缘设备能耗最小化模型,构建基于DVFS的边云协同推理框架,以联合优化边缘设备的能耗和端到端延迟;步骤3,根据步骤2构建的于DVFS的边云协同推理框架,构建基于DRL的增强型DVFS优化算法DVFO,通过联合优化边缘设备的计算频率和特征图的卸载比例来减少边缘设备的整体能耗;在步骤3中,具体包括以下步骤:步骤3.1,将步骤1建立的边缘设备能耗最小化模型中的优化目标转化为DRL中的奖励函数,并将其建模为马尔科夫决策过程MDP;所述DRL中的智能体由状态,动作和奖励三个组成部分,状态空间具体为:在每个时刻t,DRL中的智能体会构造一个状态空间;将工作负载的类型和当前测量的网络带宽B定义为状态;工作负载的类型和当前测量的网络带宽B这三个离散度量构成了状态空间,表示为;动作空间具体为:将任务的计算频率和特征图的卸载比例作为动作,则动作空间表示为,其中;所述奖励将能耗优化目标转化为奖励函数,定义智能体的奖励函数如下: 2步骤3.2,利用DQN强化学习算法来控制边缘设备的计算频率和卸载比例,以减少DRL的决策开销;所述DRL中的智能体在时刻t观测到环境的状态,当它选择一个动作的同时,之前的动作已经滑动到一个新的未观测状态,即并发环境中的状态捕获和策略决策可以并发执行;其中H是从状态到的动作轨迹的持续时间;步骤3.3,通过对标准DQN进行修改来实现并发环境下的策略决策,并且离散时间中并发环境下的DQN仍然是收敛的;因此,DQN的并发Q值函数可以重新表述如下: (3);步骤4,建立卸载机制,以解决特征图的卸载瓶颈问题,避免特征图的大小直接影响边云协同推理的端到端延迟。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学;哈尔滨工业大学(深圳),其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。