Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学苗晓晔获国家专利权

浙江大学苗晓晔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利基于两阶段搜索的学习型查询优化器构建方法与装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119415554B

龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411574118.5,技术领域涉及:G06F16/2453;该发明授权基于两阶段搜索的学习型查询优化器构建方法与装置是由苗晓晔;曲政;彭佳真;吴洋洋;尹建伟设计研发完成,并于2024-11-06向国家知识产权局提交的专利申请。

基于两阶段搜索的学习型查询优化器构建方法与装置在说明书摘要公布了:本发明公开了一种基于两阶段搜索的学习型查询优化器构建方法及装置,包括:通过基于马氏距离度量的适用域检测器,利用训练数据验证用户查询是否在优化器的适用域内;若不在适用域内,此查询将被交于底层的数据库管理系统进行处理和执行;若在适用域内,本方法将利用现有的基于束搜索的计划生成器生成最优的k个计划作为候选集,并利用数据增强后的执行计划训练挑选器;计划挑选器将利用回归模型预测候选计划的预计延时,从而选出最优查询计划,并交由数据库管理系统执行。本发明利用两阶段搜索和适用域检测的方式,提出了一种准确高效且鲁棒的查询优化器,拥有产出计划质量高、训练效率高、鲁棒性强等优点,具有广阔的应用场景。

本发明授权基于两阶段搜索的学习型查询优化器构建方法与装置在权利要求书中公布了:1.一种基于两阶段搜索的学习型查询优化器构建方法,其特征在于,包括: 收集数据库管理系统中位于目标数据集上的查询及其执行情况信息; 根据所述查询及其执行情况信息构建训练集; 根据所述训练集,构建适用域检测器; 根据所述训练集,对基于束搜索的计划生成器进行构建并训练,并使用数据重用和数据增强的技术,将训练阶段中产生的不同训练计划及其对应的执行情况存储至经验池; 根据所述的经验池中的数据,构建并训练计划挑选器; 根据所述的适用域检测器、计划生成器和计划挑选器,构建得到学习型查询优化器; 其中,收集数据库管理系统中位于目标数据集上的查询及其执行情况信息,包括: 从数据库管理系统的历史查询日志信息中筛选得到目标数据集中的查询信息,所述查询信息包括选择表列信息、连接信息、筛选谓词信息; 从数据库管理系统的历史查询日志信息中获取的查询执行情况信息,所述查询执行情况信息包括查询对应的执行计划、计划的实际执行代价及计划的执行时间; 其中,根据所述训练集,构建适用域检测器,包括: 选取训练集中的用户查询数据输入到数据库原生的查询优化器中,得到产生的对应执行计划; 将训练集中的每个样本查询和对应数据库原生查询优化器执行计划进行连接,编码为长度相等的一维向量; 依靠获得这批一维向量数据和马氏距离计算部分,构建起适用域检测器,用于对输入到优化器中的查询进行筛选,筛选具体过程为:选择阈值和采样样本数量,当查询与选定数量样本的马氏距离小于所述阈值时,将会被认为被归类为适用域内查询,否则会被归类为适用域外查询; 其中,根据所述训练集,对基于束搜索的计划生成器进行构建并训练,并使用数据重用和数据增强的技术,将训练阶段中产生的不同训练计划及其对应的执行情况存储至经验池,包括: S401:构建学习价值网络模型V,其目标是估计输入查询的子计划的总体代价,子计划的总体代价是指当前查询的所有完整计划中包含当前子计划的最小执行计划,这一指标代表着该子计划的潜力,即总体计划越小,此子计划发展成为最优计划的潜力越大; S402:设定计划生成器的束宽度b和目标个数参数k,并初始化初始计划、计划集合B和完整计划集合; S403:将所述训练集中的用户查询嵌入到统一尺寸的向量后输入到计划生成器中,对其进行训练; S404:在完整计划个数小于目标个数k时通过自底向上的方式,不断拓展计划集合中的非完整计划,并将已经完整的计划存入到完整计划集合中; S405:将计划集合B中的所有元素按照总体代价从大到小排序,仅保留前b个元素; S406:重复步骤S404-S405直至完整计划个数等于k,并利用此过程对计划生成器不断训练,并且保存此过程中产生的各类训练数据,包括用户查询、执行计划、总执行时间、子计划执行时间,经过数据增强技术扩充后,存储至经验池中,作为计划挑选器的训练样本; 其中,根据所述的经验池中的数据,构建并训练计划挑选器,包括: 构建计划挑选器,包含三层树卷积神经网络、一层池化层和两层全连接层,根据输入的查询和计划信息预测查询的执行时间和数据噪声; 使用经验池中存储的执行计划、执行子计划和对应代价信息对计划挑选器进行训练; 利用特征向量树的方式表征查询计划,以独热编码后操作符和涉及关系表、归一化后的基数估计和代价估计信息表征每个子结点上子计划的具体信息; 将执行计划对应的预测执行代价和真实执行代价输入到异方差回归损失函数中,通过在训练集上最小化异方差损失函数值,从而训练计划挑选器,得到最优参数; 其中,根据所述的适用域检测器、计划生成器和计划挑选器,构建整个学习型查询优化器,包括: 将构建得到的适用域检测器、计划生成器和计划挑选器进行组合,搭建整个学习型查询优化器; 其中适用域检测器为查询优化器的顶层模块,本模块会处理输入到查询优化器中的用户查询,并将输出结果分别输入到数据库管理系统和计划生成器中; 其中计划生成器为查询优化器的中间层模块,本模块会对输入的位于适用域内的查询进行计划生成,并将输出结果输入到计划挑选器中; 其中计划挑选器为查询优化器的底层模块,本模块会对输入的计划进行挑选,并将输出结果输入到数据库管理系统中。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。