晋江市诺鹏科技有限公司刘飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉晋江市诺鹏科技有限公司申请的专利一种用于数据标准化的人工智能系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119648389B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411806863.8,技术领域涉及:G06Q40/03;该发明授权一种用于数据标准化的人工智能系统是由刘飞;刘标;林志科设计研发完成,并于2024-12-10向国家知识产权局提交的专利申请。
本一种用于数据标准化的人工智能系统在说明书摘要公布了:本发明涉及数据标准化技术领域,具体地说,涉及一种用于数据标准化的人工智能系统,包括数据处理模块、数据标准化模块、数据混淆分析模块和数据划分模块,该一种用于数据标准化的人工智能系统中,对数据集合标准化处理后,数据混淆分析模块运用相似度对比法判断,去除多余字符时是否因字符与数据混淆而将数据作为字符去除,或是否保留字符作为数据,若出现上述情况时,则基于学习模型设定字符与数字的相似度阈值,对其混淆的数据重新划分,有效避免在去除多余字符过程中误删有效数据或保留无效字符的情况,确保数据清理的精准性,使得保留下来的数据都是真正有价值的数据,不会因为错误的清理操作而丢失关键信息。
本发明授权一种用于数据标准化的人工智能系统在权利要求书中公布了:1.一种用于数据标准化的人工智能系统,其特征在于,包括数据处理模块100、数据标准化模块200、数据混淆分析模块300和数据划分模块400; 所述数据处理模块100通过API接口协议获取借款人信息,分别通过格式字符串和字符串替换法统一借款人信息,所述数据标准化模块200用于建立借款人信息对应的数据集合,通过Z-score标准化方法对数据集合标准化处理,采用异常数值界定法判断数据集合中的异常数值; 所述数据混淆分析模块300运用相似度对比法判断异常数值是否因数据处理模块100中字符串替换法引起的,若为字符串替换法引起的,则说明字符串替换法此时将字符与数字混淆,并将对异常数值重新替换,若不为字符串替换法引起的,则说明数据标准化模块200中异常数值正常; 所述数据混淆分析模块300运用相似度对比法的步骤如下: 接收所述数据标准化模块200中判断异常数值对应的数据和所述数据处理模块100中替换的数字字符,基于学习模型设定相似度阈值,判断替换的字符是否与数值相似; 相似时,将替换的字符转换为数值,再通过所述数据标准化模块200判断数值是否异常,同理,可判断异常数值是否因数值与字符相似而造成的数值异常; 基于学习模型设定相似度阈值k的步骤如下: 接收已知相似和不相似的字符A和与其对应的数值B; 分别相似和不相似中A和B相同位置像素相同的数量: 其中,Aij和Bij分别为A和B在i行第j列的像素值,I为指示函数,如果像素值相同则为1,否则为0; 字符形状相似度计算公式为: 比较相似和不相似对应字符和数值相似度分布情况,确定相似度阈值k; 接收数据标准化模块200中判断异常数值对应的数据A1和所述数据处理模块100中数据对应替换的字符B1; 根据字符形状相似度A1和B1的相似度; 接收设定的相似度阈值k; 若Similarityshape≥k,则输出将替换的字符转换为数值或将数值替换为字符; 若Similarityshape<k,则说明所述数据处理模块100替换字符未混淆; 所述数据划分模块400包括未混淆数据判断单元410和重新划分单元420; 所述未混淆数据判断单元410用于接收所述数据混淆分析模块300判断的若不为字符串替换法引起的异常数值数量,则通过基于索引位置判断异常数值在数据集合中是否相邻,并设定数量阈值,且相邻异常数值的数量>数量阈值时,则说明数据集合中数据混淆; 所述重新划分单元420用于接收数据混淆信号,并通过所述数据标准化模块200中异常数值界定法对混淆数据重新划分,重新划分后,再次将数据标准化处理,并输出标准化数据至工作人员。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人晋江市诺鹏科技有限公司,其通讯地址为:362200 福建省泉州市晋江市池店镇唐厝村大道9号凯源商厦1号楼403室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。