浙江百应科技有限公司王磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江百应科技有限公司申请的专利基于生成对抗网络的数据过滤方法、系统、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114780716B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210260258.X,技术领域涉及:G06F16/35;该发明授权基于生成对抗网络的数据过滤方法、系统、设备和介质是由王磊设计研发完成,并于2022-03-16向国家知识产权局提交的专利申请。
本基于生成对抗网络的数据过滤方法、系统、设备和介质在说明书摘要公布了:本申请涉及一种基于生成对抗网络的数据过滤方法、系统、电子设备和存储介质,该方法包括获取命名实体数据,将命名实体数据输入生成对抗网络中预先训练好的生成器生成预设数量的合成数据,在生成对抗网络模型包括判别器的情况下,将预设数量的合成数据和命名实体数据分别输入判别器进行编码,并对编码后的数据进行分类,得到分类结果,若判断分类结果为负类的合成数据时,过滤掉该负类的合成数据,得到过滤后的合成数据,本申请解决了相关合成大量数据中存在大量脏数据,导致模型性能遭到破坏的问题,不仅提高了模型的增强效果,给下游模型的训练提高了良好的训练数据,而且还提高了合成数据的整体质量。
本发明授权基于生成对抗网络的数据过滤方法、系统、设备和介质在权利要求书中公布了:1.一种基于生成对抗网络的数据过滤方法,其特征在于,所述方法包括以下步骤: 获取命名实体数据,其中,所述命名实体数据是以名称为标识的实体数据; 将所述命名实体数据输入生成对抗网络中预先训练好的生成器生成预设数量的合成数据;其中,所述预设数量的合成数据的数量大于所述命名实体数据的数量,且所述生成对抗网络模型包括判别器; 在所述判别器包括预训练语言模型和分类器的情况下,将所述预设数量的合成数据和所述命名实体数据分别输入所述预训练语言模型进行编码,得到编码后的数据;将所述编码后的数据输入分类器,得到分类结果; 若判断分类结果为负类的合成数据时,过滤掉该负类的合成数据,得到过滤后的合成数据; 将所述预设数量的合成数据标记为负类,且将所述命名实体数据标记为正类;其中,在所述分类器为前馈神经网络的情况下,所述判别器的训练过程包括:将所述预设数量的合成数据和所述命名实体数据合并,将合并后数据作为判别器的训练数据;将所述训练数据输入所述预训练语言模型进行编码,得到编码后的数据;将所述编码后的数据输入前馈神经网络,得到分类结果,若判断分类结果为负类的合成数据时,过滤掉该负类的合成数据,得到过滤后的合成数据;基于所述前馈神经网络的最后一层网络的Softmax函数计算所述分类结果的概率误差;在所述概率误差最小时,得到训练好的判别器。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江百应科技有限公司,其通讯地址为:310000 浙江省杭州市余杭区景兴路999号梦想小镇天使村11号楼101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励