合肥大学艾兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥大学申请的专利基于联邦深度强化学习的多重网络多粒度资源优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121099375B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511299128.7,技术领域涉及:H04W28/084;该发明授权基于联邦深度强化学习的多重网络多粒度资源优化方法是由艾兵;夏伟捷;蒋梦缘;孙玉;杨梅;张美玲设计研发完成,并于2025-09-11向国家知识产权局提交的专利申请。
本基于联邦深度强化学习的多重网络多粒度资源优化方法在说明书摘要公布了:本发明公开了基于联邦深度强化学习的多重网络多粒度资源优化方法,属于边缘计算与人工智能技术领域,步骤包括:移动设备感知本地资源状态,并通过多粒度资源映射模块映射为结构化状态向量;本地FDRL训练与全局提示向量的生成;对本地FDRL训练模型进行剪枝优化,多重异构混杂网络模块基于异构链路适配机制实现异步上传;全局模型聚合、提示蒸馏与联合优化;策略回传与迭代闭环重启。本发明引入三层级+多粒度状态建模方法增强表达能力;引入离线轨迹引导机制实现策略冷启动阶段的快速收敛;采用经验优先采样+提示生成加速策略收敛;通过对本地FDRL训练模型进行剪枝降低上传开销,采用异构链路适配机制来提高传输效率与鲁棒性。
本发明授权基于联邦深度强化学习的多重网络多粒度资源优化方法在权利要求书中公布了:1.基于联邦深度强化学习FDRL的多重网络多粒度资源优化方法,其特征在于,包括以下步骤: 步骤1:系统初始化; 步骤2:移动设备感知本地资源状态,对异构资源进行精细建模,将资源状态划分为设备级、网络级、业务级三类结构层级,每一类结构层级又细分为粗粒度与细粒度,经多粒度资源映射模块映射为结构化状态向量; 步骤3:本地FDRL训练与全局提示向量的生成,具体步骤为: 3.1联邦深度强化学习控制器基于各移动设备i本地实时采集的本地经验池、局部本地FDRL训练模块上传的全局提示向量,采用离线轨迹引导机制执行联邦协调服务器初始化的本地FDRL训练,搭建个性化的本地初始化策略; 个性化的本地初始化策略公式如下: ; 其中,为策略融合权重,为本地个性化先验策略;为联邦协调服务器下发的初始全局策略; 3.2构造个性化提示向量,由移动设备在本地FDRL训练过程中记录的状态轨迹、动作轨迹、资源指标融合生成: ; 其中,表示提示特征提取函数;表示移动设备i的历史状态序列,表示历史动作序列;表示历史奖励序列; 每个移动设备在本地FDRL训练过程中,记录训练延迟、训练能耗、剪枝率、传输延迟与传输能耗,并发送至多重异构混杂网络模块; 步骤4:多重异构混杂网络模块基于、、、和计算最优剪枝比,依据最优剪枝比对本地FDRL训练模型进行结构压缩,生成轻量化本地策略参数向量;通过计算不同链路的效用函数,移动设备自主选择合适的上传路径; 步骤5:联邦协调服务器周期性聚合轻量化本地策略参数向量;融合各移动设备的个性化提示向量,完成提示蒸馏,生成统一的全局提示向量;构建包含、、和的多目标奖励函数; 步骤6:联邦协调服务器将下一轮的全局策略参数向量、下一轮的全局提示向量,以及重要性权重参数下发至各移动设备。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥大学,其通讯地址为:230000 安徽省合肥市经济技术开发区锦绣大道99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励