北京天拓力行科技有限公司尹诗莲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京天拓力行科技有限公司申请的专利一种积存数据去重优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120631259B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510716673.5,技术领域涉及:G06F3/06;该发明授权一种积存数据去重优化方法及系统是由尹诗莲设计研发完成,并于2025-05-30向国家知识产权局提交的专利申请。
本一种积存数据去重优化方法及系统在说明书摘要公布了:本发明公开了一种积存数据去重优化方法及系统,涉及数据管理技术领域,包括步骤:S1、数据预处理;S2、滚动哈希计算;S3、位操作与有限状态表示;S4、去重决策与状态更新;S5、性能监控与调整;所述系统包括数据预处理模块、哈希计算模块、位向量管理模块、去重决策模块、性能监控模块和优化调整模块。该积存数据去重优化方法及系统,在数据写入磁盘之前,先对数据进行哈希计算,并将哈希值与磁盘上的数据进行比对,如果数据已经存在,则直接返回该数据的引用,否则将数据写入磁盘并更新索引。不仅有效地去除重复数据,提高数据存储效率,且不占用内存空间,同时保证了数据处理的实时性与准确性。
本发明授权一种积存数据去重优化方法及系统在权利要求书中公布了:1.一种积存数据去重优化方法,其特征在于,包括以下步骤: S1、数据预处理:对输入数据进行预处理,使数据格式统一; S2、滚动哈希计算:选择一个哈希函数,用于将预处理后的数据映射到一个固定大小的哈希值,并实现滚动哈希算法,以逐字符或逐块地处理输入数据,实时更新当前的哈希值; S3、位操作与有限状态表示:设计一个固定大小的位向量,用于记录已经见过的哈希值,并将计算得到的哈希值映射到位向量的一个或多个位上,使用位操作来更新和查询位向量; S4、去重决策与状态更新:根据位向量的状态来做出去重决策,并更新位向量的状态以反映最新的数据接收情况; S5、性能监控与调整:监控去重算法的性能,包括哈希冲突率、数据处理速度,并根据需要进行调整; 所述步骤S2中,滚动哈希算法利用前一个数据块的哈希值和当前加入的新数据块来计算整个数据流的当前哈希值,无需重新计算整个数据流的哈希,具体流程如下: 初始化:在处理开始之前,先计算初始数据块的哈希值作为基准; 逐字符或逐块处理:随着数据流的持续输入,逐字符或逐块地更新哈希值,即移除旧字符或数据块影响,以及加入新字符或数据块影响; 实时更新:随着数据流的输入,不断实时更新当前的哈希值; 所述步骤S5中具体包括以下子步骤: S51、冲突率监控:通过记录哈希冲突的次数和总哈希计算次数,计算出位向量的冲突率,即不同数据产生相同哈希值导致位向量中相同位被多次设置的概率,若发现冲突率过高,则更换哈希函数或增加位向量大小; S52、内存使用优化:通过监控工具或内存使用计数器来跟踪内存使用情况,并根据实际应用场景和数据量的变化,动态调整位向量的大小以优化内存使用; S53、算法参数调整:根据性能监控结果,调整哈希函数的参数、位向量的大小,以优化去重效果和内存使用。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京天拓力行科技有限公司,其通讯地址为:100094 北京市海淀区永丰路9号院3号楼A座2层中段131号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励