东北大学肖焰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利一种基于累积分布的学习型基数估计方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120067148B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510135645.4,技术领域涉及:G06F16/2453;该发明授权一种基于累积分布的学习型基数估计方法和系统是由肖焰;王中迪;王佳;聂铁铮;申德荣;寇月设计研发完成,并于2025-02-07向国家知识产权局提交的专利申请。
本一种基于累积分布的学习型基数估计方法和系统在说明书摘要公布了:本发明公开一种基于累积分布的学习型基数估计方法和系统,涉及数据库查询优化技术领域。该方法在保证高精度的同时确保了稳定性。这种稳定性保证了生成的执行计划的一致性,从而有助于商业数据库性能的持续稳定。累积分布函数可以直接提供随机变量在任意区间内的累计概率,这对于评估变量落在特定范围内的概率非常方便。相比之下,使用概率密度函数或概率质量函数确定区间概率需要进行积分或求和,这不仅更复杂,还可能导致更大的误差。与此同时,该方法对高维数据的推理加速显著降低了延迟,带来了显著的性能提升,对于大规模数据处理尤其具有重要价值。
本发明授权一种基于累积分布的学习型基数估计方法和系统在权利要求书中公布了:1.一种基于累积分布的学习型基数估计方法,其特征在于,包括以下步骤: 步骤1:将数据库基数估计问题转换为基于累积分布函数的概率问题,对数据库基数估计问题进行建模,得到基数估计问题概率模型; 步骤2:获取表格数据,然后对表格数据进行反离散化,得到反离散化后的表格数据; 步骤3:对反离散化后的表格数据进行标准化,得到标准化后的表格数据; 步骤4:将标准化后的表格数据输入深度神经网络进行训练,拟合累积分布函数,得到连续多变量累积分布逼近函数; 步骤5:对待估计的查询语句进行编码得到向量编码,在向量编码中加入连续性修正因子进行连续性修正,得到修正后的向量编码; 步骤6:将修正后的向量编码按照步骤3中的方法进行标准化,得到标准化后的向量编码; 步骤7:将步骤4中拟合得到的连续多变量累积分布逼近函数,应用于步骤1得到的基数估计问题的概率模型中,将标准化后的向量编码输入基数估计问题的概率模型,最终得到基数估计结果; 所述步骤1具体为: 首先,设定查询语句: selectcount*fromtwherel1≤x1≤r1andl2≤x2≤r2…andln≤xn≤rn1 其中,selectcount*表示符合where条件的元组个数,t表示要查询的表格,xi表示要查询的表格中第i个属性的值,i为属性的编号,n为属性的数量,li和ri分别为第i个属性的取值下界和上界; 然后设定查询区域Ω=[l1,r1]×…×[ln,rn],随机变量X=X1,X2,…,Xi,…,Xn的多变量累积分布函数定义为: FXx=PrX1≤x1,X2≤x2,…,Xn≤xn2 其中,FXx表示随机变量X的多变量累积分布函数,Xi表示第i个随机变量,向量x=x1,x2,…,xi,…,xn; 设定变量si∈{0,1},向量s=s1,s2,…,si…,sn,|s|=s1+s2+…+sn,定义变量vi∈{li,ri},向量v=v1,…,vi,…,vn,且: 基数估计问题的概率模型为: 其中,FXv为随机变量X的多变量累积分布函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路3号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励