厦门市美亚柏科信息股份有限公司陈云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门市美亚柏科信息股份有限公司申请的专利一种隐性关键词提取方法、终端设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114372461B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111488191.7,技术领域涉及:G06F40/284;该发明授权一种隐性关键词提取方法、终端设备及存储介质是由陈云;杜新胜;吴松洋;蔡勇恩;汤增荣设计研发完成,并于2021-12-07向国家知识产权局提交的专利申请。
本一种隐性关键词提取方法、终端设备及存储介质在说明书摘要公布了:本发明涉及一种隐性关键词提取方法、终端设备及存储介质,该方法中包括:S1:设定分类维度和每个分类维度下包含的不同类别,按照每个分类维度下的各类别对取证数据进行文本提取,并构建为不同类别下的文本库;S2:对各类别下的文本库中的文本进行分词处理,将分词处理后的结果组建为各类别下的词组库;S3:针对每个词组库中的词进行过滤处理;S4:计算词组库中各词与已知关键词进行相似度,剔除相似度小于相似度阈值的词;S5:计算词组库中各词在取证数据中的权重,剔除权重小于权重阈值的词;S6:根据经过上述步骤处理后的词组库得到各类别下的隐性关键词。本发明实现了对海量取证数据中的涉案隐性关键词的自动挖掘。
本发明授权一种隐性关键词提取方法、终端设备及存储介质在权利要求书中公布了:1.一种隐性关键词提取方法,其特征在于,包括以下步骤: S1:设定分类维度和每个分类维度下包含的不同类别,按照每个分类维度下的各类别对取证数据进行文本提取,并构建为不同类别下的文本库; S2:对各类别下的文本库中的文本进行分词处理,将分词处理后的结果组建为各类别下的词组库; S3:针对每个词组库中的词进行过滤处理;过滤处理包括以下步骤: S31:对词组库中的词进行停用词过滤处理,剔除词组库中的停用词; S32:基于经过步骤S31处理后的词组库,根据每个词的词性,对词组库中的词进行词性过滤处理,剔除词组库中不需要的词性对应的词; S33:基于经过步骤S32处理后的词组库,根据构建的用于存储常用关键词的白名单词库,剔除词组库中存在于白名单词库中的词; S34:基于经过步骤S33处理后的词组库,根据每个词的词频,对词组库中的所有词进行高斯分布,按照隐性关键词对应的分布区间,从高斯分布结果中提取该分布区间对应的词,将其它词从词组库中剔除; S4:基于经过步骤S3处理后的词组库,针对词组库中的每个词,将其与该词组库对应类别下的已知关键词进行相似度计算,在词组库中剔除相似度小于相似度阈值的词; S5:基于经过步骤S4处理后的词组库,针对词组库中的每个词,通过IF-IDF算法计算每个词在取证数据中的权重,在词组库中剔除权重不符合权重范围的词; S6:根据经过步骤S5处理后的词组库,得到各类别下的隐性关键词,具体为将经过步骤S5处理后的词组库作为当前时间段对应的词组库,将其与历史时间段对应的关键词库交集运算,将当前时间段对应的词组库与交集运算结果的差中的词作为词组库对应类别下的隐性关键词。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门市美亚柏科信息股份有限公司,其通讯地址为:361000 福建省厦门市软件园二期观日路12号102-402单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。