Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浪潮云信息技术股份公司李重阳获国家专利权

浪潮云信息技术股份公司李重阳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浪潮云信息技术股份公司申请的专利基于k-means优化算法提高Kettle转换效率的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115292397B

龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210890267.7,技术领域涉及:G06F16/25;该发明授权基于k-means优化算法提高Kettle转换效率的方法是由李重阳;孙思清设计研发完成,并于2022-07-27向国家知识产权局提交的专利申请。

基于k-means优化算法提高Kettle转换效率的方法在说明书摘要公布了:本发明公开了基于k‑means优化算法提高Kettle转换效率的方法,所述方法通过对Kettle转换步骤的执行时间进行预处理,使用最大最小归一化算法进行数据的标准化,得到一组经过标准化的数据;通过k‑means的优化算法进行分组,生成分组数量,采用非随机方式选择质心。本发明动态地记录了Kettle转换步骤的时间,使用一种改良过的k‑means算法对步骤进行分组,自动进行参数的管理和线程的扩展,提高了Kettle的转换效率,减少了人工调参的时间。相比较不使用该方法,转换效率提高了20%。

本发明授权基于k-means优化算法提高Kettle转换效率的方法在权利要求书中公布了:1.基于k-means优化算法提高Kettle转换效率的方法,其特征在于,所述方法通过对Kettle转换步骤的执行时间进行预处理,使用最大最小归一化算法进行数据的标准化,得到一组经过标准化的数据; 通过k-means的优化算法进行分组,生成分组数量,采用非随机方式选择质心; 其中,最大最小归一化算法的公式为: 最终数据=原始数据-最小数据最大数据-最小数据; 所述分组数量的确定过程如下: 在样本里所在的区域中按照均匀分布随机产生和原始样本数一样多的随机样本,并对这个随机样本做K-Means处理,从而得到一个Dk 重复上述步骤n次,得到n个logDk; 对这n个数值求平均值,得到ElogDk的近似值; 使用Gapstatistic方法,计算公式公式如下: GapK=ElogDk-logDk 其中Dk为损失函数,ElogDk是logDk的期望; Gapstatistic取得最大值所对应的K就是最佳的分组数量K; 所述质心的选择过程如下: 1先从所有的数据点集合中随机选择一个点作为第一个分组的质心; 2对于数据集中的每一个点x,计算它与最近聚类中心的距离Dx; 3选择一个新的数据点作为新的聚类中心,选择的原则是:Dx较大的点,被选取作为聚类中心的概率较大; 4重复2和3,直到k个聚类中心被选出来; 5利用这k个初始的聚类中心来运行标准的k-means算法; 所述距离Dx的计算过程如下: 1先从数据库中随机挑个随机点当“种子点”; 2对于每个点,都计算其和最近的一个“种子点”的距离Dx并保存在一个数组里,然后把这些距离加起来得到SumDx; 3取一个随机值,用权重的方式来取计算下一个“种子点”,具体算法如下: 先取一个能落在SumDx中的随机值Random,然后用Random-=Dx,直到其=0,此时的点就是下一个“种子点”; 所述方法的实现过程还包括: 在分组数量生成,质心的非随机选择后,将距离各质心较近的点划分至各分组,完成分组; 分组结束后可直观的看到各个分组的执行时间范围和每组中的步骤数; 所述方法的实现过程还包括: 通过预设每个分组对应的不同线程数,然后通过调用StepMeta类的setCopiesString方法设置复制数量,从而增加分组中各步骤的线程数; 通过调用TransMeta类的addParameterDefinition方法添加命名参数,实现动态收集各个步骤的执行时间,并基于收集到的信息自动分组,设置合适的参数和线程数,以此提高Kettle的转换效率; 所述方法的实现过程还包括: 对于某个步骤的步骤度量较其他步骤长很多的步骤度量,将这种长步骤拆分成多个短步骤,变相的增加并发,加快Kettle的转换效率。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云信息技术股份公司,其通讯地址为:250100 山东省济南市高新区浪潮路1036号浪潮科技园S01号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。