福建天晴数码有限公司刘德建获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉福建天晴数码有限公司申请的专利一种基于哈希表的离散型高效模糊搜索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115599780B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110766945.4,技术领域涉及:G06F16/22;该发明授权一种基于哈希表的离散型高效模糊搜索方法及系统是由刘德建;陈高武;黄斌;张笛;姚鸿;王柟;陈军;宋诗莹;林琛设计研发完成,并于2021-07-07向国家知识产权局提交的专利申请。
本一种基于哈希表的离散型高效模糊搜索方法及系统在说明书摘要公布了:本发明提供了一种基于哈希表的离散型高效模糊搜索方法,所述方法包括以下步骤:步骤S1、加载源数据,对源数据进行分词和过滤;步骤S2、建立哈希表;步骤S3、将哈希表持久化保存;步骤S4、加载源数据的哈希表;步骤S5、用户输入查找内容,对查找的内容进行分词和过滤;步骤S6、分词后,插入每个词的同义词或近义词;步骤S7、在源数据的哈希表中搜索每个查找的词,统计每个词的频率和位置集合;步骤S8、根据词的频率和位置计算匹配度,根据匹配度排序和输出结果;本发明能够进行相似度匹配且效率高。
本发明授权一种基于哈希表的离散型高效模糊搜索方法及系统在权利要求书中公布了:1.一种基于哈希表的离散型高效模糊搜索方法,其特征在于,所述方法包括以下步骤: 步骤S1、加载源数据,对源数据进行分词和过滤; 步骤S2、建立哈希表; 步骤S3、将哈希表持久化保存; 步骤S4、加载源数据的哈希表; 步骤S5、用户输入查找内容,对查找的内容进行分词和过滤; 步骤S6、分词后,插入每个词的同义词或近义词; 步骤S7、在源数据的哈希表中搜索每个查找的词,统计每个词的频率和位置集合; 步骤S8、根据词的频率和位置计算匹配度,根据匹配度排序和输出结果; 所述步骤S2进一步具体为:计算每个词的哈希值,统计每个词在源数据中的位置,生成位置列表,构建哈希表; 所述步骤S7进一步具体为:遍历分词列表,对每个分词求哈希值,通过哈希值直接定位对应的槽位,找出对应的源数据ID和分词所在源数据中的位置信息; 所述步骤S8进一步具体为:根据分词的位置离散程度计算匹配度分值,计算公式如下:其中:n:为要查找内容的分词列表的长度;max:求最大值函数;k:常数,这里等于5;min:求最小值函数;xi:第i个分词的位置列表;通过分词出现频率的维度计算匹配度分值,计算公式如下:其中:max:求最大值函数;lenXi:第i个分词的位置列表长度,即第i个分词出现的次数;k:常数,同位置离散程度公式中的k;将匹配分值转化成相似度,计算公式如下:通过sim的相似度值,对查找的结果进行排序,并输出完成搜索过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建天晴数码有限公司,其通讯地址为:350000 福建省福州市君竹路83号科技发展中心大楼第四层Q476室(自贸试验区内);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。