沈阳航空航天大学;北京可利邦信息技术股份有限公司杜文友获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉沈阳航空航天大学;北京可利邦信息技术股份有限公司申请的专利一种面向样本不平衡问题的纵向联邦数据增强方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119150321B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411235196.2,技术领域涉及:G06F21/60;该发明授权一种面向样本不平衡问题的纵向联邦数据增强方法是由杜文友;王海航;孟光磊;焦耀光设计研发完成,并于2024-09-04向国家知识产权局提交的专利申请。
本一种面向样本不平衡问题的纵向联邦数据增强方法在说明书摘要公布了:本发明一种面向样本不平衡问题的纵向联邦数据增强方法,包括以下步骤:协调方生成同态加密密钥对,保留私钥,向参与方中的参与者I和参与者II分发公钥;同时参与者I和参与者II生成各自加密密钥对,保留己方私钥,向对方发送公钥;协调方基于私钥解密加密距离矩阵,得到未加密的距离矩阵,基于随机放弃原则,生成插值信息,通过参与者II发送的公钥加密后,发送给参与者II;判断少量样本数量是否达到需求,参与者I将所将此过程中所有参与者I新样本Xg_new的少类样本添加至参与者I原始数据Xg,多类样本对参与者I原始数据Xg中的未用于插值的样本部分进行替换,实现参与者I和参与者II原始数据中多类样本和少类样本的平衡。
本发明授权一种面向样本不平衡问题的纵向联邦数据增强方法在权利要求书中公布了:1.一种面向样本不平衡问题的纵向联邦数据增强方法,其特征在于:包括以下步骤: 步骤1:协调方生成同态加密密钥对,保留私钥,向参与方中的参与者I和参与者II分发公钥;同时参与者I和参与者II生成各自加密密钥对,保留己方私钥,向对方发送公钥; 步骤2:获取参与者I原始数据中少类样本和呈倍数的多类样本作为插值的样本,生成加密距离矩阵; 步骤3:协调方基于私钥解密加密距离矩阵,得到未加密的距离矩阵,对协调方距离矩阵每行距离信息升序排列,将对应的索引保存在一个矩阵,并将其发送给参与者I; 步骤4:参与者I根据近邻数K,在找到每个样本除自身外的K个同类近邻,记为集合; 步骤5:参与者I基于随机放弃原则,生成插值信息,通过参与者II发送的公钥加密后,发送给参与者II; 步骤6:参与者II通过密钥解密参与者I发送的加密信息,得到插值信息,参与者I和参与者II通过插值信息并结合SMOTE的插值原理,生成新的样本:参与者I和参与者II得到各自的新样本和,参与者Ⅰ将新样本添加至对齐后用于插值的样本 中,参与者II将新样本添加至对齐后插值的样本中,用于下一轮插值; 步骤7:参与者I判断少量样本数量是否达到需求,若未达到,返回步骤3;若达到需求,赋予参与者I新样本和参与者II新样本相同ID信息,参与者II将此过程中所有的添加至,参与者I将此过程中所有参与者I新样本的少类样本添加至参与者I原始数据,多类样本对参与者I原始数据中的未用于插值的样本部分进行替换,实现取参与者I和参与者II原始数据中多类样本和少类样本的平衡; 所述基于随机放弃原则,生成插值信息,通过参与者II发送的公钥加密后,发送给参与者II的过程如下: 参与者I使用随机放弃原则,即针对每一个样本引入一个随机放弃因子,并根据样本的类别给予随机放弃因子不同的放弃阈值,少类样本的放弃阈值记为,多类样本的放弃阈值记为,当大于对应阈值后,则跳过此样本,不进行插值;针对需要进行插值的样本随机生成一个插值节点权重,最后,参与者I将需要进行插值的样本索引以及其在中对应K个紧邻中随机选取的一个近邻索引和对应的插值权重打包,并通过参与者II发送的公钥加密后,发送给参与者II。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沈阳航空航天大学;北京可利邦信息技术股份有限公司,其通讯地址为:110000 辽宁省沈阳市道义经济开发区道义南大街37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。