中国铁塔股份有限公司安徽省分公司魏杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国铁塔股份有限公司安徽省分公司申请的专利一种招标信息筛选方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120783363B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511292212.6,技术领域涉及:G06V30/42;该发明授权一种招标信息筛选方法、系统、设备及存储介质是由魏杰;沈勇设计研发完成,并于2025-09-11向国家知识产权局提交的专利申请。
本一种招标信息筛选方法、系统、设备及存储介质在说明书摘要公布了:本公开涉及招标信息筛选领域,公开了一种招标信息筛选方法、系统、设备及存储介质,所述方法包括通过爬虫程序获取目标网站的网页信息;基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域;从所述招标信息所在的结构化数据区域中提取招标信息;对提取的所述招标信息进行多维度去重处理,得到去重后招标信息;对所述去重后招标信息进行自动化分类处理,得到标注类别的招标信息;对所述标注类别的招标信息进行结构化处理,输出筛选后的招标信息。本公开能够精准定位网页中的招标信息区域,以及实现跨网站及长期动态变化下的招标信息稳定识别。
本发明授权一种招标信息筛选方法、系统、设备及存储介质在权利要求书中公布了:1.一种招标信息筛选方法,其特征在于,包括: 通过爬虫程序获取目标网站的网页信息; 基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域; 从所述招标信息所在的结构化数据区域中提取招标信息; 对提取的所述招标信息进行多维度去重处理,得到去重后招标信息; 对所述去重后招标信息进行自动化分类处理,得到标注类别的招标信息; 对所述标注类别的招标信息进行结构化处理,输出筛选后的招标信息; 所述基于预设的网页结构识别规则库,从所述目标网站的网页信息中自动识别网页中招标信息所在的结构化数据区域,包括: 通过DOM树解析和XPath路径动态生成算法,定位包含招标关键词的节点集群,并确定招标关键词的节点集群在网页中对应区域信息,输出招标关键词的节点集群区域; 对目标网站的网页信息进行视觉块密度分析,确定信息密集区域; 将所述招标关键词的节点集群区域和所述信息密集区域的交集区域确定为招标信息所在的结构化数据区域; 所述对目标网站的网页信息进行视觉块密度分析,确定信息密集区域,包括: 将目标网站的网页信息进行渲染,形成网页渲染后的布局; 将网页渲染后的布局分割为矩形视觉区块; 计算各矩形视觉区块的文本密度值与链接密度值; 根据招标信息特征动态设定密度阈值; 基于密度阈值和文本密度值与链接密度值,筛选出信息密集候选区块; 对信息密集候选区块,按文本密度与信息熵的计算结果进行排序,将排序中前设定数量的区块所对应的结构化数据区域确定为信息密集区域; 所述根据招标信息特征动态设定密度阈值,包括: 基于历史招标信息样本构建文本密度直方图,识别历史招标信息样本的分布模式; 对单峰右偏分布的分布模式,根据箱线图计算密度阈值;对双峰分布的分布模式,计算双峰间谷底偏移量值; 判断双峰间谷底偏移量值是否超过安全上限值; 当双峰间谷底偏移量值未超过安全上限值时,将双峰间谷底偏移量值作为密度阈值; 当双峰间谷底偏移量值超过安全上限值时,采用约束值作为密度阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国铁塔股份有限公司安徽省分公司,其通讯地址为:230061 安徽省合肥市高新开发区长宁社区服务中心复兴社区高塔路6号1-3层、7-10层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励