北京联合永道软件股份有限公司张春获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京联合永道软件股份有限公司申请的专利一种非结构化数据存储方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118410124B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410881790.2,技术领域涉及:G06F16/31;该发明授权一种非结构化数据存储方法及系统是由张春;梁兰设计研发完成,并于2024-07-03向国家知识产权局提交的专利申请。
本一种非结构化数据存储方法及系统在说明书摘要公布了:本发明涉及非结构化数据存储技术领域,具体公开了一种非结构化数据存储方法及系统,所述方法包括获取非结构化的评论信息,根据Word2Vec词向量模型将评论信息转换为词向量矩阵;将评论信息转换为数据节点,根据词向量矩阵计算任意两个评论信息的相似度,根据所述相似度确定数据节点之间的连接关系;基于连接向量对数据节点进行聚类,创建节点簇,根据节点簇中各个节点的词向量矩阵构建节点簇的特征矩阵;基于节点簇更新各个节点的连接关系;本发明将评论信息转换为数据节点,基于图结构存储评论信息,在存储阶段,同步构建各个数据节点的连接关系,进而生成一种类似于知识图谱的存储架构,可阅读性极高,便于后续的分析处理过程。
本发明授权一种非结构化数据存储方法及系统在权利要求书中公布了:1.一种非结构化数据存储方法,其特征在于,所述方法包括: 获取非结构化的评论信息,根据Word2Vec词向量模型将评论信息转换为词向量矩阵,词向量矩阵中的每个词向量都对应一个字词; 将评论信息转换为数据节点,根据词向量矩阵计算任意两个评论信息的相似度,根据相似度确定数据节点之间的连接关系;所述连接关系包括两个相互连接的数据节点的名称和连接向量;所述连接向量的模长为相似度,所述连接向量的方向为前一时刻的评论信息的数据节点指向后一时刻的评论信息的数据节点; 基于连接向量对数据节点进行聚类,创建节点簇,根据节点簇中各个节点的词向量矩阵构建节点簇的特征矩阵; 基于节点簇更新各个节点的连接关系; 所述将评论信息转换为数据节点,根据词向量矩阵计算任意两个评论信息的相似度,根据所述相似度确定数据节点之间的连接关系的步骤包括: 读取评论信息的词向量矩阵,计算词向量矩阵中任意两个词向量的向量距离; 计算每个词向量与其他词向量的平均向量距离,选取平均向量距离小于预设的距离阈值的词向量,读取词向量对应的字词,作为节点名称; 计算词向量矩阵的数据量,根据数据量确定节点尺寸,根据节点尺寸创建数据节点,将节点名称插入数据节点;词向量的行数对应词向量的维度,词向量的列数与字词的个数呈正比,所述数据量由列数确定,数据节点是圆,节点尺寸是半径; 相似度的计算过程为: ;式中,S为两个词向量矩阵的相似度,i表示较小列数的词向量矩阵在较大列数的词向量矩阵的遍历起点列数,j表示较小列数的词向量矩阵中的列数;M是较小列数的词向量矩阵的总列数,是较大列数的词向量矩阵的总列数;为较小列数的词向量矩阵中的第个列向量,为较大列数的词向量矩阵中的第个列向量;为和的向量距离;为最小值选取函数; 所述基于节点簇更新各个节点的连接关系的步骤包括: 依次选取节点簇,遍历节点簇中的数据节点,读取数据节点的连接关系; 查询连接关系中另一数据节点的节点名称,判断其是否属于同一节点簇; 当所述另一数据节点的节点名称不属于同一节点簇时,查询另一数据节点所在的节点簇的节点簇名称; 将连接关系中另一数据节点的节点名称替换为节点簇名称; 基于连接向量生成与节点簇相连的上层向量; 所述基于连接向量生成与节点簇相连的上层向量的步骤包括: 读取节点簇的特征矩阵; 读取数据节点对应的词向量矩阵,由词向量矩阵遍历所述特征矩阵,计算最大相似度; 保留连接向量的方向,将最大相似度作为模长,生成由数据节点至节点簇的向量,作为连接向量的上层向量; 其中,所述上层向量嵌套所述连接向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京联合永道软件股份有限公司,其通讯地址为:100085 北京市海淀区上地东路1号院3号楼6层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。