浙江工业大学黄钟汀获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于数据挖掘的高维剧场数据降维可视化处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114328663B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111616059.X,技术领域涉及:G06F16/2458;该发明授权一种基于数据挖掘的高维剧场数据降维可视化处理方法是由黄钟汀;陈永毅;张丹设计研发完成,并于2021-12-27向国家知识产权局提交的专利申请。
本一种基于数据挖掘的高维剧场数据降维可视化处理方法在说明书摘要公布了:一种基于数据挖掘的高维剧场数据降维可视化处理方法,属于剧场设备信息管理技术领域。它包括以下步骤:1、对高维剧场设备运行大数据进行降维处理;2、对异构数据的信息进行融合,并对融合的高维数据信息提取频繁序列模式;3、对剧场设备运行数据进行聚类处理;4、训练剧场设备运行数据向量,并根据词向量构成句子向量进行文本分类,将优化后的向量在二维语义空间进行语义可视化表示。本发明通过对海量剧场设备高维数据进行降维处理,将相似的文本收敛到可处理的量级,同时结合相关的半监督学习以及隔离森林算法对降维数据文件进行分类,设计数据分类模型算法并进行可视化展示,优化剧场设备运维数据的管理,实现高效准确的运维。
本发明授权一种基于数据挖掘的高维剧场数据降维可视化处理方法在权利要求书中公布了:1.一种基于数据挖掘的高维剧场数据降维可视化处理方法,其特征在于,包括以下步骤: 1将多源异构剧场设备运行数据进行初步整理,针对其中的多源模糊冲突信息,基于不精确推理理论的隔离森林异常检测分类技术和流形学习中的等距映射ISOMAP的非线性降维算法,在保持局部几何特征的前提下,对高维剧场设备运行大数据进行降维处理; 2针对剧场设备运行数据的异构性和多源性,分别对异构数据的信息进行抽取融合、多源数据融合和冲突融合,对融合的高维数据信息提取频繁序列模式,从日志信息中发现高维数据之间的关联性,构建日志信息序列; 3基于深度学习以及半监督学习的日志分析方法,对剧场设备运行数据进行聚类处理:以等距映射算法为基础,将相似度大于0.75的高维数据收敛到可处理的量级,同时结合相应的半监督学习以及深度学习方法对日志文件进行分类; 4使用Skip-gram模型来训练剧场设备运行数据向量,并根据词向量构成句子向量进行文本分类,以此来衡量词向量的质量,优化训练词向量的迭代次数、维度以及调整训练模型以及语料的大小;经过优化后的词向量作为CNN模型的输入,并在二维语义空间进行语义可视化表示; 所述步骤4的具体过程如下: 4.1、采用Skip-gram模型预测上下文目标词,从而最大化整个语料库∑w,c∈D∑wj∈ClogPwwj,其中,Pwwj表示通过softmax函数产生第w个单词的多项式分布、wj表示词序列[w1,w2,…,wj]、w为字典中的任意词、c为w的上下文词、D为从调度语料中抽取出的字典;模型每次从目标词的上下文选择n个词,并将其词向量映射到对应的TF-IDF向量作为模型的输入; 4.2、采用Jaccard算法来计算日志信息的相似度:使用Jaccard距离进行预处理,将相似度小于0.25的日志数据筛选出去,接着再使用编辑距离进行判断,从而实现对日志的聚类收敛,以及给所有数据赋值唯一的id。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310006 浙江省杭州市拱墅区朝晖六区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。