哈尔滨工业大学巢泽敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于DTW距离的时序数据全长度频繁模式挖掘方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117009419B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311066879.5,技术领域涉及:G06F16/2458;该发明授权一种基于DTW距离的时序数据全长度频繁模式挖掘方法是由巢泽敏;于永航;王宏志;齐志鑫设计研发完成,并于2023-08-23向国家知识产权局提交的专利申请。
本一种基于DTW距离的时序数据全长度频繁模式挖掘方法在说明书摘要公布了:本申请具体涉及一种基于DTW距离的时序数据全长度频繁模式挖掘方法、设备及存储介质,涉及数据挖掘技术领域。本发明的目的是解决现有基于动态时间规整的算法中存在难以同时满足不同长度的频繁模式的算法挖掘过程中的有效和高效的要求的问题,提供了一种时序数据全长度频繁模式挖掘方法、设备及存储介质,可以对室外温度的时序数据计算不同长度的频繁模式,通过重新利用之前获得的下界结果,可以极大的减少计算成本与时间,并在程序结束后传递回精确解,极大的提高发掘全长度频繁模式的效率,当算法运行完成后,就可以获取所有长度的最优频繁模式;解决了同时满足不同长度的频繁模式的算法挖掘过程中的有效性和高效性要求的问题。
本发明授权一种基于DTW距离的时序数据全长度频繁模式挖掘方法在权利要求书中公布了:1.一种基于DTW距离的时序数据全长度频繁模式挖掘方法,其特征在于:用于批处理基于室外温度的时序数据S,包括以下步骤: S1:获取基于室外温度的时序数据s=s1,s2,…,sn,并确定用户指定的频繁模式的长度区间[Lmin,Lmax],使用STAMP算法从时序数据S中提取欧式距离度量下,子序列距离不高于阈值的多个子序列对;计算提取的全部子序列对之间的动态时间规整DynamicTimeWarping距离,简称DTW距离,取提取的全部子序列对中DTW距离最小的一对子序列,作为最佳值,分别放入fir_min[Lmin]和sec_min[Lmin];其中fir_min[Lmin]和sec_min[Lmin]均表示记录频繁模式位置的向量; 所述 为实数集,n为维度; 所述长度区间中Lmax≤n;Lmin≥1; S2:计算长度区间[Lmin,Lmax]内所有长度L为Lmin的频繁模式对应的下界函数的关键值,并根据下界函数的关键值,每一对长度为Lmin的子序列的长度由Lmin扩展为Lmin+1,Lmin+2,…,Lmax时,计算得到扩展后每一对子序列对应的DTW距离下界函数偏移量上限 扩展操作即将长度为Lmin的子序列对扩展成长度为Lmin+K的子序列的操作,其中,表示为时序数据S中第i个位置作为起点的长度为Lmin的子序列,表示为时序数据S中以第j个位置作为起点的长度为Lmin的子序列;所述的DTW距离下界函数为一个距离函数,以下简称为下界函数; S3:计算长度区间[Lmin,Lmax]内的所有长度所对应的最优频繁模式;所述计算长度区间[Lmin,Lmax]内长度为L时所对应的最优频繁模式方法包括以下步骤: S3.1:计算长度区间[Lmin,Lmax]内长度为L时所对应的最优频繁模式下界; 首先将时序数据S中长度为L的全部子序列对视为候选项,候选项的集合为Θ,然后利用最优下界计算方法对于每个候选项进行计算,得到当前长度L的所对应的最优频繁模式下界; 所述最优下界计算方法包括以下步骤: S3.1.1:计算当前候选项所对应的长度为L的频繁模式的下界函数和当前长度为L的候选项对应的之间的差值,并判断当前最优频繁模式的DTW距离是否大于等于此差值,若满足条件,则跳过计算当前L长度候选项的的DTW距离下界,并丢弃当前候选项,若不满足条件,则对其进行保留,在对集合Θ中的所有候选项进行判断后,进入S3.1.2; 所述当前最优频繁模式为长度为L+K以内获得的;和表示当前最优频繁模式的子序列对; S3.1.2:将S3.1.1中未被丢弃的候选项集合记为Θ',对Θ'中的全部候选项计算DTW距离下界,获得当前长度L的最优频繁模式下界; S3.2:根据获得当前长度L的最优频繁模式下界,通过动态时间规整的方法,检查所有的候选项,得到在长度为L最优频繁模式,然后根据长度为L最优频繁模式的DTW距离更新最佳值; S3.3:将长度为的L最优频繁模式中每个子序列中的位置分别存储在向量fir_min与[L]向量sec_min[L]中; S3.4:判断长度区间[Lmin,Lmax]内各长度最优频繁模式是否均计算完毕,若是,则进入S4,否则进入S3.5; S3.5:将当前发掘的频繁模式的长度值L更新为L+1,更新完毕后,返回S3.1; S4:得到存储有长度区间[Lmin,Lmax]内所有长度的最优频繁模式位置的向量fir_min与向量sec_min。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。