中机寰宇认证检验股份有限公司杜敏杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中机寰宇认证检验股份有限公司申请的专利一种数据集质量分析评估方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120781083B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511205891.9,技术领域涉及:G06F18/214;该发明授权一种数据集质量分析评估方法是由杜敏杰;孙海鹏;刘继永;龚琳;崔德贵;王荧设计研发完成,并于2025-08-27向国家知识产权局提交的专利申请。
本一种数据集质量分析评估方法在说明书摘要公布了:本发明属于数据质量分析领域,具体公开一种数据集质量分析评估方法,通过对当前数据集先进行完整性评估,仅在数据组数量达标后方启动数据置信分析,确保置信评估建立在结构完整的数据基础上,避免因数据缺失导致的误判,提升分析可靠性,与此同时在数据置信分析时通过构建各数据组的相邻数据集,实施当前数据与局部时序邻域的动态对比;同时结合历史参考数据集,进行与历史波动范围的纵向对比,融合局部一致性与历史可比性双重校验,很大程度上提升了异常检测灵敏度与评估准确性,最后在基于数据集完整性与置信评估结果进行可用性判定时通过与采集端建立闭环反馈通路,能够依据风险定位结果实现采集策略的自适应调整。
本发明授权一种数据集质量分析评估方法在权利要求书中公布了:1.一种数据集质量分析评估方法,其特征在于,包括以下步骤: 数据完整性评估:对数据采集端获取的当前数据集进行数据组数量统计,并与预设数量阈值对比; 若数据组数量达标,执行数据置信分析步骤; 若数据组数量未达标,识别缺失数据组的分布特征判定为连续性缺失或间断性缺失; 当判定为连续性缺失时,直接生成不可用结论; 当判定为间断性缺失时,基于现存数据组执行局部置信分析; 数据置信分析:对达标的完整数据集执行邻域数据组间波动分析,并结合与历史数据波动范围的对比分析判定是否存在置信风险; 数据可用性决策:根据数据完整性评估结果与数据置信分析结果生成可用性判定结论,所述结论包括有效可用、部分可用或不可用; 当判定为有效可用时保留当前数据集,部分可用时保留有效数据组并标记失效数据组,不可用时作废当前数据集; 采集优化反馈:针对部分可用及不可用结论向数据采集端发送重采集指令; 所述数据置信分析如下操作:基于当前数据集中各数据组的采集时间戳按时间顺序构建每个数据组对应的邻域数据组集;针对每项监测指标在邻域数据组集内计算其数值序列的标准差,并与预设的指标稳定性阈值进行比较,若某项监测指标在邻域数据组集的标准差高于指标稳定性阈值,则采用算术均值作为该项指标的邻域参考值,反之则采用中位数作为该项指标的邻域参考值;对每个数据组中的每一项监测指标计算其数值与对应邻域参考值之间的绝对偏差,并计算绝对偏差相对于邻域参考值的比例作为各数据组相对邻域数据组集中每项指标的波动率;基于当前数据集采集的环境参数和采集时段从历史参考数据库中检索具有相同环境配置和时段特征的历史数据组序列构建历史匹配数据集;针对历史匹配数据集统计每项监测指标的历史波动范围;将每个数据组的各项指标波动率及其原始数值分别与允许波动率阈值及历史波动范围进行双重校验:若存在任意数据组中某项指标的波动率超过预设限值或该指标的原始数值超出对应历史波动范围,则判定当前数据集存在置信风险,并标记该数据组为风险数据组,反之则判定当前数据集不存在置信风险。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中机寰宇认证检验股份有限公司,其通讯地址为:102600 北京市大兴区北臧村镇天荣街32号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励