华东师范大学;上海嗨普智能信息科技股份有限公司魏森辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华东师范大学;上海嗨普智能信息科技股份有限公司申请的专利基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115238908B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210251482.2,技术领域涉及:G06N20/00;该发明授权基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法是由魏森辉;高明;蔡文渊;杜蓓;刘翔设计研发完成,并于2022-03-15向国家知识产权局提交的专利申请。
本基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法在说明书摘要公布了:本发明公开了一种基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法,该方法通过联邦学习架构共同训练每个本地客户端的变分自编码器,并且针对不同客户端数据域的差异,提出利用无监督聚类算法来对不同客户端进行分组,然后在每个簇内单独进行联邦学习模型训练,很大程度上缓解了数据域差异给联邦模型训练带来的危害,最终每个组可以训练得到一个全局生成模型。在预测阶段就可以利用训练好的全局生成模型产生更多安全的共享的数据,为更多机器学习和深度学习任务提高有效的数据支撑。
本发明授权基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法在权利要求书中公布了:1.一种基于变分自编码器、无监督聚类算法和联邦学习的数据生成方法,其特征在于,按如下步骤进行数据生成: 模型训练阶段 步骤S1:在联邦学习每一轮的通信过程中,中央服务器从所有本地客户端中随机选择比例为K1的本地客户端,然后将中央服务器的编码器参数发送给被选中的本地客户端,用于更新其编码器参数;其中K1的选择范围是10%-50%; 步骤S2:被选中的本地客户端利用本地训练集进行生成模型变分自编码器的训练,定义均方误差损失函数以及KL散度作为优化目标,使用梯度下降作为优化方法,迭代地训练本地模型; 步骤S3:本地训练结束后,被选中的客户端通过网络通信传输的方式,将本地变分解码器中的编码器参数上传到中央服务器; 步骤S4:中央服务器聚合从本地客户端上传的编码器参数,更新中央服务器的编码器参数; 步骤S5:重复步骤S1-步骤S4,直到所有本地客户端都至少被中央服务器选择3-5次,将当前中央服务器的编码器参数发送给所有客户端,本地客户端编码器更新参数; 步骤S6:每个本地模型通过编码器将自己的原始数据映射到低维空间上,并且在这个低维空间上利用无监督聚类算法K-means++进行聚类,得到G1个组,对每个组的低维向量取平均值,然后将得到低维向量上传到中央服务器;其中G1为3-5; 步骤S7:中央服务器在接收到所有本地客户端发送过来的低维向量后,利用无监督聚类算法K-means++进行聚类,将所有低维向量分成G2个组,将属于某个客户端的低维向量最多的组作为该客户端被分到的组;其中G2为4-8; 步骤S8:在完成对本地客户端分组后,在每个组内独立地进行联邦学习模型训练; 步骤S9:每个组内的客户端在每一轮通信过程中,当前组的中央服务器从当前组的所有本地客户端中随机选择比例为K2的本地客户端,然后将当前组的中央服务器的编码器和解码器参数发送给被选中的本地客户端,更新其编码器和解码器参数;其中K2的选择范围是40%-80%; 步骤S10:每个组内被选中的客户端,进行同步骤S2的本地模型训练; 步骤S11:每个组内被选中的客户端通过网络通信传输的方式,将本地变分自解码器中的编码器和解码器的参数上传到当前组的中央服务器; 步骤S12:每个组内的中央服务器聚合从本地客户端上传的编码器和解码器参数,更新当前组中央服务器的编码器和解码器参数; 步骤S13:重复步骤S9-步骤S12,直到每个组的模型收敛或达到固定的通信轮数,停止训练,每个组得到一个最终的全局生成模型; 模型预测阶段 步骤S14:从标准正态分布中采集Ns个随机样本,其中,Ns根据具体业务场景调整; 步骤S15:每个组的客户端利用全局生成模型的解码器,将随机样本映射成逼真的安全的共享的数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学;上海嗨普智能信息科技股份有限公司,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。