南京大学李猛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利一种用于只读场景下加速查询的高效学习型索引构建方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120508560B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510588203.5,技术领域涉及:G06F16/22;该发明授权一种用于只读场景下加速查询的高效学习型索引构建方法与系统是由李猛;戴海鹏;陈贵海;周昭辰;王瀚橙设计研发完成,并于2025-05-08向国家知识产权局提交的专利申请。
本一种用于只读场景下加速查询的高效学习型索引构建方法与系统在说明书摘要公布了:本发明公开了一种用于只读场景下加速查询的高效学习型索引构建方法与系统。所述方法先假设用分布简化模型构建策略处理数据集,将数据键按每组k个分组,取每组首键为代表键,用PLA算法训练,计算出分段段数上限;接着定义二维动态规划数组;从首个代表键起,用PLA算法拟合,成功则初始化代价信息与空间大小,失败则用分布重映射模型策略;然后从初始段数开始至上限,外层枚举段数,内层枚举分段点,计算并更新最小空间开销,保存结果;最后按计算的分段段数从后往前取模型信息,整合得到最优分段策略。本发明有效约束了只读学习型索引的误差,降低了索引的查询时间,并且具有索引空间占用小、索引高度低和预测误差小的优点。
本发明授权一种用于只读场景下加速查询的高效学习型索引构建方法与系统在权利要求书中公布了:1.一种用于只读场景下加速查询的高效学习型索引构建方法,其特征在于,用于内存数据库中,包括以下步骤: 通过假设对数据集使用分布简化模型构建策略,计算出分段段数的上限,所述分布简化模型构建策略将数据集中的键按照个一组进行分组,取每组的第一个键作为每个组的代表键,参与数据集模型的训练; 对数据排序并按分组粒度划分,提取各分组代表键存入代表键数组,定义二维动态规划数组,其元素存储代表键划分为指定段数的代价信息,从代表键数组首个键开始,使用近似线性约束PLA算法尝试以分布简化模型构建策略对代表键做线性拟合,拟合成功则初始化对应代价信息,包括从数据集开始到当前项的模型所用空间大小;拟合失败后后续代表键用分布重映射模型构建策略初始化,同时计算并更新相邻代表键差值最小值;所述分布重映射模型构建策略利用一个大于的扩展系数将数据集中的代表键扩展到更大的一段空间中; 设置分段段数初始值,从该初始值开始至段数上限,在外层循环中枚举每一种分段的段数,对于每一个分段段数,在内层循环中枚举最后一段模型的分段点,针对每个分段点,计算最后一段模型的模型构建策略及相关代价,使用PLA算法尝试加入代表键,根据加入结果选择合适的模型构建策略并计算空间开销,更新当前层的最小空间开销,找出最小值并保存相关变量及模型信息,将计算结果保存至二维动态规划数组中,依次迭代,直至完成所有分段段数的枚举; 从二维动态规划数组中,依据计算出的数据集分段段数,从后往前依次取出模型信息,前一段模型信息由当前模型存储的变量确定,循环直至遍历到数组第一层,整合获取的信息,得到模型的最优分段策略; 所述方法能够降低索引的查询时间,索引空间占用小。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励