北京梆梆安全科技有限公司李洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京梆梆安全科技有限公司申请的专利一种基于搜索引擎的网站分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121188306B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511727035.X,技术领域涉及:G06F16/958;该发明授权一种基于搜索引擎的网站分类方法是由李洋;吕文昊;陈彪;阚志刚设计研发完成,并于2025-11-24向国家知识产权局提交的专利申请。
本一种基于搜索引擎的网站分类方法在说明书摘要公布了:本发明涉及数据分类技术领域,尤其涉及一种基于搜索引擎的网站分类方法。该方法包括以下步骤:输入待检测网站域名信息,并检测域名有效性,利用检测结果建立查询任务队列;基于查询任务队列调动搜索引擎接口,以获取网站分类标签;根据网站分类标签识别网站标签特征;根据网站标签特征进行相似度聚类计算,形成聚类簇;基于网站分类标签进行加权融合,确定综合置信度;利用聚类簇修正综合置信度,生成优化综合置信度;根据优化综合置信度分析网站分类标签的可信程度;基于可信程度对待检测网站域名信息进行网站最终分类,并根据最终网站分类结果生成网站分类报告。本发明基于数据分类技术实现对网站的自动分类,提高网站分类准确率和可靠性。
本发明授权一种基于搜索引擎的网站分类方法在权利要求书中公布了:1.一种基于搜索引擎的网站分类方法,其特征在于,包括以下步骤: 步骤S1:输入待检测网站域名信息,并检测域名有效性,利用检测结果建立查询任务队列;基于查询任务队列调动搜索引擎接口,以获取网站分类标签; 步骤S2:根据网站分类标签识别网站标签特征;根据网站标签特征进行相似度聚类计算,形成聚类簇;基于网站分类标签进行加权融合,确定综合置信度,步骤S2中根据网站标签特征进行相似度聚类计算,形成聚类簇包括: 利用网站标签特征提取对应的特征得分,将特征得分标准化为[0,1]区间,构建标签特征向量;根据标签特征向量计算相似度矩阵,包括: 根据标签特征计算余弦相似度,并将余弦相似度填入对应的矩阵单元中,形成二维矩阵;基于二维矩阵定义3×3或5×5的邻域窗口; 利用邻域窗口对二维矩阵中的每个单元的邻域;计算每个单元的邻域的加权平均值,并将当前单元的原始值替换加权平均值,生成相似度矩阵; 基于相似度矩阵执行标签聚合,形成聚类簇; 在标签聚合过程中,设定相似度阈值为0.6~0.9,当相似度矩阵高于阈值上限时自动合并为同一聚类簇;当相似度低于阈值下限时独立保留为单标签簇,步骤S2中基于网站分类标签进行加权融合,确定综合置信度包括: 建立标签对齐窗口,窗口大小固定为3~5个标签单元,以预设1~2个标签单元依次滑动,对网站分类标签进行归并聚合,记录聚合标签集合; 提取聚合标签集合中的原始置信度值,按标签来源分配权重系数并执行加权运算,生成初步融合置信度;基于初步融合置信度执行归一化处理,记录归一化系数; 利用归一化系数对初步融合置信度中波动超过0.15的标签标记为不稳定标签,并在加权时自动降低其权重10%~20%,确定综合置信度; 步骤S3:利用聚类簇修正综合置信度,生成优化综合置信度;根据优化综合置信度分析网站分类标签的可信程度; 步骤S4:基于可信程度对待检测网站域名信息进行网站最终分类,并根据最终网站分类结果生成网站分类报告。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京梆梆安全科技有限公司,其通讯地址为:100080 北京市海淀区学院路30号科大天工大厦A座20层1至3室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励