中电科大数据研究院有限公司;电子科技大学曹扬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中电科大数据研究院有限公司;电子科技大学申请的专利基于深度强化学习的联邦学习激励方法、装置及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121365705B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511936222.9,技术领域涉及:G06N3/092;该发明授权基于深度强化学习的联邦学习激励方法、装置及系统是由曹扬;蔡惠民;董厚泽;韩国权;朱策;谢红韬设计研发完成,并于2025-12-22向国家知识产权局提交的专利申请。
本基于深度强化学习的联邦学习激励方法、装置及系统在说明书摘要公布了:本发明公开了一种基于深度强化学习的联邦学习激励方法、装置及系统,该方法包括:获取各参与方客户端用户在当前轮次迭代训练后上传的模型参数;根据所述模型参数进行迭代测试,得到各参与方客户端用户的多维度测试参数;将参与方客户端用户的多维度测试参数及当前轮次需要按比例用于支付的总费用输入预先构建的激励分配模型,确定对应该参与方客户端用户的奖励。利用本发明方案,可以对联邦学习的参与方实现有效的激励分配,提升高贡献客户端的参与积极性。
本发明授权基于深度强化学习的联邦学习激励方法、装置及系统在权利要求书中公布了:1.一种基于深度强化学习的联邦学习激励方法,其特征在于,所述方法包括: 获取各参与方客户端用户在当前轮次迭代训练后上传的模型参数; 根据所述模型参数进行迭代测试,得到各参与方客户端用户的多维度测试参数,具体包括:对所有参与方客户端用户的模型参数进行聚合,得到第一聚合参数,生成基于所述第一聚合参数的第一模型;对排除特定客户端用户后的模型参数进行聚合,得到第二聚合参数,生成基于所述第二聚合参数的第二模型;利用设定的测试集分别对所述第一模型和第二模型进行迭代测试,得到测试结果;根据所述测试结果计算得到所述特定客户端用户的多维度测试参数; 将所有参与方客户端用户的多维度测试参数输入预先构建的激励分配模型,确定当前轮次迭代所需的费用比例及各参与方客户端用户的激励分配比例;所述激励分配模型基于DDPG深度强化学习算法构建; 根据剩余的资金总额、所述当前轮次迭代所需的费用比例以及各参与方客户端用户的激励分配比例,计算得到各参与方客户端用户的奖励; 每次迭代同时关注两个目标,即模型聚合后的loss和剩余的金额;为此,通过将两个目标相乘使奖励数值能同时兼顾这两个因素,即满足以下条件: 5 其中,代表第t次迭代对于激励分配模型的奖励数值,lossGt代表第t次迭代聚合模型在测试集上的目标损失值,代表服务端第t次迭代剩余的资金总额;ema_lossGt代表lossGt的指数移动平均,T表示移动窗口大小; 通过DDPG深度强化学算法,迭代训练激励分配模型,实现激励分配模型参数更新。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中电科大数据研究院有限公司;电子科技大学,其通讯地址为:550081 贵州省贵阳市观山湖区长岭南路160号高科一号C栋30层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励