Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 武汉众邦银行股份有限公司汪大磊获国家专利权

武汉众邦银行股份有限公司汪大磊获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉武汉众邦银行股份有限公司申请的专利一种JSON数据自动结构化并入库的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115185944B

龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210788130.0,技术领域涉及:G06F16/22;该发明授权一种JSON数据自动结构化并入库的方法是由汪大磊;李耀;田羽;兰翔;徐浩;彭一凡设计研发完成,并于2022-07-04向国家知识产权局提交的专利申请。

一种JSON数据自动结构化并入库的方法在说明书摘要公布了:本发明涉及数据处理领域,提供了一种JSON数据自动结构化并入库的方法。主旨在于解决如何将多种数据源的不同JSON数据结构入库的问题,只要方案包括判断接入JSON数据源的类型,根据类型不同采用不同的方法,获取JSON数据;数据的预处理,对数据进行脏数据排查并处理,得到标准的JSON字段;对不同JSON数据源的类型获得的JSON进行解析处理,并约定好数据文件的格式,生成标准的数据文件;对数据结构化处理进度探查,生成ok文件;对生成的数据文件进行准确性校验,得到校验后的标准的数据文件;对数据文件采用批次处理入库的操作,完成数据文件入库。

本发明授权一种JSON数据自动结构化并入库的方法在权利要求书中公布了:1.一种JSON数据自动结构化并入库的方法,其特征在于,包括以下步骤: 步骤1、判断接入JSON数据源的类型,根据类型不同采用不同的方法,获取JSON数据; 步骤2、数据的预处理,对数据进行脏数据排查并处,得到标准的JSON字段; 步骤3:对不同JSON数据源的类型获得的JSON进行解析处理,并约定好数据文件的格式,生成标准的数据文件;步骤3包括以下步骤: 步骤3.1.1:对于储存在非关系型数据库Elasticsearch中的数据,连接到该数据库中,然后查询到需要结构化的数据,为了保证效率,采用批次查询,从数据库中,取得需要结构化的JSON数据,然后对该数据进行结构化的处理,首先取得JSON数据中的标识性数据字段,来用作标识,确定数据的来源和属性,标识性数据字段有且不止一条,按照业务来确定,接着将JSON数据中每个节点的key和value都循环取出来,保证数据的完备性,为了效率会使用多线程的操作; 步骤3.1.2:对步骤3.1.1获得的数据做标准处理后,一条JSON数据变成多条以标识字段为索引,key和value值作为属性的多条数据,采用要将数据写入到数据文件中,生成标准的数据文件,更加方便将数据导入到对应的数据库中,约定好数据文件的格式,首先,数据文件第一行是数据库表的表头字段,用特定的分割符来区分字段,采用将一条JSON数据解析成的多条数据写入到文件的操作,生成标准的数据文件; 步骤3.2:对储存在结构化数据库中的数据,先确认好字段的类型,字段是标准的数据字段,采用写入到数据文件中的方案,得到标准的数据文件,对储存在结构化数据库中的JSON字段数据,运用3.1.1中同样的操作,首先取得JSON数据中的标识性数据字段,来用作标识,确定数据的来源和属性,标识性数据字段有且不止一条,按照业务来确定,接着将JSON数据中每个节点的key和value都循环取出来,保证数据的完备性,根据数据量的大小,采用线程池的方式对数据进行解析的处理操作,在对数据处理完成之后,一条JSON数据变成多条以标识字段为索引,key和value值作为属性的多条数据,采用要将数据写入到数据文件中,生成标准的数据文件,更加方便将数据导入到对应的数据库中,约定好数据文件的格式,首先,数据文件第一行是数据库表的表头字段,用特定的分割符来区分字段,采用将一条JSON数据解析成的多条数据写入到文件的操作,生成标准的数据文件; 步骤3.3:对储存在KAFKA中的数据,首先确定好数据所在的消费组,然后开始消费需要取得的数据,和步骤2.1的方式一样,对数据进行预处理,先剔除掉一些垃圾数据和脏数据,取到数据之后为了数据处理的效率,也是用多线程的处理方式,对数据进行同样的处理,因为Kafka中的数据获取的时候是实时消费的,所以为了保持和别的数据同步的情况,会在日期进行切换的时间点,对前一天的数据进行保存,并将下一天的数据生成到新的数据文件中,并生成一个标识文件来确定前一天的数据已经解析完成,从而才能正常的将前一天的数据文件加载到对应的数据库表中; 步骤4:对步骤3数据结构化处理进度探查,生成ok文件; 步骤5:对步骤3中生成的数据文件进行准确性校验,得到校验后标准的数据文件; 步骤6:对数据文件采用批次处理入库的操作,完成数据文件入库。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉众邦银行股份有限公司,其通讯地址为:432200 湖北省武汉市黄陂区盘龙城经济开发区汉口北大道88号汉口北国际商品交易中心D2区1-2层、22-23层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。