北京智享嘉网络信息技术有限公司王佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京智享嘉网络信息技术有限公司申请的专利一种基于数据中台的企业多源数据实时同步系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120045619B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411936041.1,技术领域涉及:G06F16/27;该发明授权一种基于数据中台的企业多源数据实时同步系统是由王佳;高雪挺;刘景娇设计研发完成,并于2024-12-26向国家知识产权局提交的专利申请。
本一种基于数据中台的企业多源数据实时同步系统在说明书摘要公布了:本发明涉及一种基于数据中台的企业多源数据实时同步系统,该系统采用容器化部署方式及分层架构,包括接入层、处理层、分发层及控制层;接入层与数据中台通信,从数据中台获取原始数据;接入层设有数据接入适配器模块,处理层设有数据格式处理模块,分发层设有数据路由分发模块,控制层设有一致性保障模块;数据接入适配器模块用于多源异构数据的统一接入;数据格式处理模块用于对接入的多源异构数据进行数据标准化处理;数据路由分发模块用于智能数据路由和分发;一致性保障模块用于保证数据同步的一致性。本发明实现了数据同步延迟降低,系统吞吐量提高,数据一致性得到有效保证,特别适用于企业核心业务系统的数据同步和跨系统数据集成场景。
本发明授权一种基于数据中台的企业多源数据实时同步系统在权利要求书中公布了:1.一种基于数据中台的企业多源数据实时同步系统,其特征在于,采用容器化部署方式及分层架构,包括数据接入层、数据处理层、数据分发层及数据控制层;所述数据接入层与数据中台通信,从所述数据中台获取原始数据; 所述数据接入层设有数据接入适配器模块,所述数据处理层设有数据格式处理模块,所述数据分发层设有数据路由分发模块,所述数据控制层设有一致性保障模块;各层之间通过标准化接口进行通信,以确保系统的可扩展选性和维护性; 所述数据接入适配器模块用于多源异构数据的统一接入,包括关系型数据库适配单元、分布式数据库适配单元、数据仓库适配单元及搜索引擎适配单元,分别用于接入关系型数据库、分布式数据库、数据仓库、搜索引擎;所述数据接入适配器模块,采用插件式结构,支持动态加载和管理,以及对数据源的个性化扩展;所述数据接入适配器模块包括适配器管理单元,用于统一管理各类适配器的生命周期,实现适配器的动态部署和升级; 所述数据格式处理模块用于对接入的多源异构数据进行数据标准化处理,并将处理后的标准化数据发送至所述数据路由分发模块; 所述数据路由分发模块用于: 在数据路由过程中,实时监控各节点的负载状态,结合历史数据,利用ARIMA模型进行动态负载预测;以CPU使用率、内存利用率作为时间序列的输入数据,预测模型如下: yt=c+φ1yt-1+φ2yt-2+…+φpyt-p+∈t; 式中,yt为当前时间t的预测值;c为常数项,表示预测数据的长期均值趋势;φ1,φ2,…,φp为自回归系数,用于衡量过去p个时间点的值对当前值的影响,反映每个指标的短期趋势,包括CPU使用率的当前值可能受过去某些时刻值的强烈影响;yt-1,yt-2,…yt-p为前p个时间点的历史数据,包括过去的CPU使用率、内存利用率数据;∈t为随机误差,表示负载预测过程中无法用历史数据解释的部分,包括瞬时的非规律性突发负载; 基于负载预测结果,采用自适应路由策略,将数据流动态分发到最优节点,并采用基于消息中间件的流量控制机制,防止系统过载,保证数据处理的稳定性;其中,所述自适应路由策略考虑节点负载、网络状况、数据亲和性因素,基于蚁群算法进行优路由选择,以确保数据分发的均衡性和效率; 所述基于蚁群算法进行优路由选择的步骤如下: 步骤1:初始化: 初始信息素浓度,设置为一个常值τij0=τ0;设为初始值τ0; 初始化系统状态:采集每个节点的当前负载Lj和路径带宽Bij; 步骤2:计算路径权重: 综合权重公式: 其中: Lj:节点j的负载,越低越优; Bij:路径Pij的剩余带宽,越高越优; α,β:权重因子,控制负载和带宽对决策的影响; 步骤3:路径选择: 选择概率公式: 其中: τijt:路径Pij的信息素浓度; Wij:路径Pij的综合权重; η,γ:参数,分别控制信息素和路径权重的重要性; 步骤4:信息素更新: 更新公式: τijt+1=1-ρτijt+Δτij; 其中: 1-ρ:信息素挥发因子,防止信息素无限增长; Δτij:新增的信息素,表示路径质量; 所述一致性保障模块用于: 实时捕获源数据的变更信息,采用基于哈希校验的多级一致性校验方法,针对建立的数据一致性校验点,定期对源端和目标端的数据进行校验,若发现数据异常,则自动进行数据修复,以保证数据同步的一致性,并通过分布式事务协调机制,确保在分布式环境下数据操作的原子性和一致性;所述基于哈希校验的多级一致性校验方法如下: 步骤1:传输数据生成哈希值 步骤1.1,生成数据块: 将需要传输的数据分为多个部分,包括字段级、表级、全局级,每个部分分别生成哈希值; 设数据块为Di,其中i=1,2,...,n; 步骤1.2,计算源端哈希值: 对数据块Di使用哈希函数H生成对应的哈希值hi: hi=HDi: 生成全局级别的综合哈希值Hglobal,通过所有数据块的哈希值组合: Hglobal=Hh1||h2||...||hn; 其中,||表示字符串拼接操作; 步骤1.3,附加哈希值: 将计算出的哈希值hi和Hglobal附加到数据包中,随数据一起传输到目标端; 步骤2目标端接收数据并重新计算哈希值 步骤2.1,提取数据块: 在目标端接收数据后,提取传输数据Di′以及附加的哈希值hi和Hglobal: 步骤2.2,计算目标端哈希值: 对接收的数据块Di′使用相同的哈希函数H重新计算哈希值h′i: h′i=HD′i; 计算目标端的全局哈希值Hglobal′: yHglobal′=Hh′1||h′2||...||h′n; 步骤3对比源端与目标端的哈希值 3.1逐级对比: 字段级校验: hfield,i=HDfield,i; 式中,hfield,i表示字段i的哈希值;Dfield,i表示字段i的原始数据; 表级校验: htable=Hhfield,1||hfield,2||...||hfield,n; 式中,htable表示表的哈希值; 全局级校验: hglobal=Hhtable,1||htable,2||...||htable,m; 式中,hglobal表示全局哈希值; 步骤3.2,校验逻辑: 从字段级别到全局级别逐层对比,发现最小粒度的差异后停止进一步对比; 步骤4触发修复流程 步骤4.1,回溯历史变更记录: 使用变更记录系统,查找源端与目标端在传输过程中发生的变更: 查找Di在传输路径中的修改日志; 确定数据传输时的差异位置; 步骤4.2,精准定位异常: 根据变更记录,确定受影响的数据块Di及其位置; 步骤4.3,修复数据: 将源端的正确数据重新发送至目标端,覆盖异常数据块; 对修复后的数据重新计算哈希值,并再次进行校验,确保数据一致; 所述企业多源数据实时同步系统还包括性能优化模块,所述性能优化模块包括: 增量识别单元,用于识别数据增量变化,包括: 通过布隆过滤器记录同步过的数据,仅识别新增或变更的数据,以减少数据传输量,具体流程如下: 步骤1初始化布隆过滤器并加载源数据哈希 步骤1.1,布隆过滤器初始化: 布隆过滤器是一个长度为m的位数组,初始时所有位都设为0; 定义k个独立的哈希函数集合H=H1,H2,...,Hk,每个函数将输入映射到布隆过滤器的一个位置; 步骤1.2,加载源数据: 对于源数据集合中的每个元素x,计算其k个哈希值: Hix1≤i≤k,i为当前使用的哈希函数编号,取值范围为1,2,…k; 根据哈希值,将对应位置的位设置为1: B[Hix]=1foralli; 结果:源数据中所有元素的哈希值在布隆过滤器中标记为1; 步骤2对新数据计算哈希值并检查布隆过滤器 步骤2.1,新数据检测: 对于每个新数据元素y,使用同样的k个哈希函数计算哈希值: Hiy1≤i≤k 2.2布隆过滤器检查: 检查布隆过滤器中的对应位是否全为1: 其中: Fy:表示y是否已存在于布隆过滤器中; 若Fy=True,则认为y已存在; 若Fy=False,则认为y是新增或变更数据; 步骤3将新增数据加入同步任务 步骤3.1,数据分类: 若Fy=True,将y标记为新增数据,并加入同步任务队列; 若Fy=False,跳过该数据,避免重复同步; 步骤3.2,布隆过滤器更新: 对于新增数据y,将其哈希值对应的布隆过滤器位设置为1: [B[Hiy]=1foralli]; 并行处理单元,用于基于分布式计算框架的并行处理机制,将数据处理任务分散到多个节点并行执行; 数据压缩单元,用于数据传输压缩优化,包括: 基于LZ4的高效压缩算法,实现智能的数据压缩策略,具体流程如下: 步骤1对输入数据流分块处理,提取重复模式; 步骤1.1,将输入数据流S分为多个数据块Bi,每个数据块大小为LBi; 步骤1.2,原始数据总量: 步骤1.3,在每个数据块中,通过滑动窗口机制提取重复模式,并标记重复段的起始位置和长度; 步骤2通过滑动窗口匹配数据块,替换为指针或符号; 步骤2.1,使用滑动窗口匹配数据块中的重复段,将匹配段替换为指针p,l,未匹配的数据作为字面量保留; 步骤2.2,对每个数据块的压缩后大小计算: CBi=LBi-RBi; 其中: RBi为匹配数据段替换为指针后减少的字节数; 步骤3:传输压缩后的数据,目标端解压 步骤3.1,传输压缩后的所有数据块,压缩后的总数据量: 步骤3.2,目标端接收到压缩数据后,根据指针p,l和字面量重建原始数据,验证: LS=CS+RS: 式中,LS表示原始数据量,CS表示压缩后数据量,RS为压缩率; 资源调度单元,基于容器技术实现资源调度; 性能监控单元,用于系统性能监控。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京智享嘉网络信息技术有限公司,其通讯地址为:102600 北京市大兴区北京经济技术开发区荣华南路1号院2号楼11层1107;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励