北京八分量信息科技有限公司阮安邦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京八分量信息科技有限公司申请的专利数据噪声的滤除方法、装置及相关产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116451033B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310265925.8,技术领域涉及:G06F18/15;该发明授权数据噪声的滤除方法、装置及相关产品是由阮安邦;魏明;王佳帅;王铀之设计研发完成,并于2023-03-14向国家知识产权局提交的专利申请。
本数据噪声的滤除方法、装置及相关产品在说明书摘要公布了:本申请公开了一种数据噪声的滤除方法、装置及相关产品。方法包括:对目标数据进行属性标注处理,得到对应的属性特征描述;根据属性特征描述,对目标数据的特征连续性和离散性分别进行评估,得到连续性评估值以及离散性评估值;基于连续性评估值以及离散性评估值,将目标数据划分为连续性数据集以及离散性数据集;根据设定的第一信息熵,确定连续性数据集中的第一噪声;根据设定的第二信息熵,确定离散性数据集中的第二噪声;从连续性数据集中滤除第一噪声得到连续性净数据,从离散性数据集中滤除第二噪声得到离散性净数据;根据连续性净数据以及离散性净数据,生成净数据集合,从而实现了去噪的更细粒度实现,提高了噪声处理的准确度。
本发明授权数据噪声的滤除方法、装置及相关产品在权利要求书中公布了:1.一种数据噪声的滤除方法,其特征在于,包括: 调用设定的放回式数据抽样机制,以从目标数据集中抽取样本数据,并将抽取到的样本数据作为目标数据; 对目标数据进行属性标注处理,得到对应的属性特征描述,包括:获取分布式处理集群中控制节点发布的调度命令;根据所述调度命令,调用标注节点对目标数据进行属性标注处理,得到对应的属性特征描述; 对所述目标数据进行分块处理,得到若干数据块,包括:基于标注节点的数量,针对所述目标数据,进行数据切块处理,得到若干个数据块,使得所述数据块的数量与所述标注节点的数量对等;所述对目标数据进行属性标注处理,得到对应的属性特征描述,还包括:以数据块为单位进行属性标注处理,得到每个数据块对应的属性特征向量;对所有数据块对应的属性特征向量进行拼接处理,得到所述目标数据对应的属性特征描述; 根据所述属性特征描述,对所述目标数据的特征连续性和离散性分别进行评估,得到连续性评估值以及离散性评估值,包括:计算所述属性特征描述中不同属性特征向量之间的注意力值;根据所述注意力值,对所述目标数据的特征连续性和离散性分别进行评估,得到连续性评估值以及离散性评估值; 基于所述连续性评估值以及所述离散性评估值,将所述目标数据划分为连续性数据集以及离散性数据集,包括:从所述若干数据块中筛选出连续性评估值之间的步长小于设定的连续值阈值的数据块,以组成所述连续性数据集;从所述若干数据块中筛选出连续性评估值之间的步长大于等于所述设定的连续值阈值的数据块,以组成所述离散性数据集; 根据设定的第一信息熵,确定所述连续性数据集中的第一噪声; 根据设定的第二信息熵,确定所述离散性数据集中的第二噪声; 从所述连续性数据集中滤除所述第一噪声得到连续性净数据,从所述离散性数据集中滤除所述第二噪声得到离散性净数据; 根据所述连续性净数据以及所述离散性净数据,生成净数据集合,包括:基于所述连续性净数据和所述离散性净数据之间的注意力矩阵,对所述连续性净数据以及所述离散性净数据进行融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京八分量信息科技有限公司,其通讯地址为:100015 北京市朝阳区崔各庄乡东辛店村268号院1号楼二层204号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励