厦门理工学院蔡志文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门理工学院申请的专利基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120086426B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510577955.1,技术领域涉及:G06F16/951;该发明授权基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备是由蔡志文;许阳旸;刘程瑞设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。
本基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备在说明书摘要公布了:本发明提供的基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备,涉及数据爬取技术领域。本发明根据电子商务网站的历史数据构建初始异构图,并采用多层次并行图卷积操作生成节点和边的多尺度嵌入向量,构建多层次图神经网络;引入跨层次融合注意力和层级门控机制对多层次图神经网络的每一层进行层内自注意力处理并动态调整不同层次的权重分配;再进行多尺度嵌入向量的跨层融合,同时引入Transformer模块得到最终嵌入向量;通过实时获取网站反馈信息更新多层次图神经网络,并生成当前状态空间嵌入向量;最后,结合奖励函数进行电子商务网站爬取结果的评价分析,以实时调整网站反爬策略。本发明能够实现对电子商务网站环境状态的实时感知与动态优化。
本发明授权基于GNN学习的电子商务反爬虫对抗爬取方法、装置及设备在权利要求书中公布了:1.一种基于GNN学习的电子商务反爬虫对抗爬取方法,其特征在于,包括: S1,根据电子商务网站的历史日志数据构建图神经网络的初始异构图; S2,根据所述初始异构图采用多层次并行图卷积操作,生成节点和边的多尺度嵌入向量,构建多层次图神经网络; S3,引入跨层次融合注意力和层级门控机制,对所述多层次图神经网络的每一层进行层内自注意力处理并动态调整不同层次之间的权重分配,得到多尺度自注意力嵌入向量;具体为: 构建多层次图神经网络后,基于不同层次的嵌入表示,采用标准自注意力机制对每一层的内部信息进行建模,并引入层级重要性评分函数计算每一层的重要性权重,以动态调整各层贡献,表达式为: ; ; 其中,表示第层的嵌入表示;表示进行标准自注意力后的嵌入表示,即第层的自注意力嵌入向量;表示标准自注意力函数; 表示第层的重要性权重;表示第层的自注意力嵌入向量;M表示图神经网络的总层数;表示重要性评分函数; S4,将所述多尺度自注意力嵌入向量进行跨层融合,并引入Transformer模块进行全局交互建模,得到最终嵌入向量; S5,实时获取网站反馈信息更新所述多层次图神经网络,并结合所述最终嵌入向量生成当前状态空间嵌入向量; S6,根据当前状态空间嵌入向量结合奖励函数进行电子商务网站信息的爬取与评价,以实时调整网站反爬策略;所述奖励函数为: ; 其中,表示当前状态的奖励;表示当前状态,根据所述当前状态空间嵌入向量得到;表示当前状态下所采取的动作;、、、、为设置的权重; 表示根据网站页面返回状态给予的奖励或惩罚,正常返回奖励,错误返回惩罚;表示根据网站页面内容的重要程度给予的差异化奖励,页面内容价值越高奖励越高;表示对请求频率进行的惩罚性约束,请求频率过快或过慢均给予相应惩罚;表示根据代理网站IP的状态进行的奖励或惩罚;表示奖励符合人类特征的行为,惩罚机械性明显的爬取行为; 还包括,基于当前状态奖励与环境反馈信息,动态调整所述奖励函数的权重参数,表达式为: ; 其中,为当前时刻t的权重参数集合;表示动态调整的学习率;表示求导符号;表示当前状态的奖励;表示当前状态,根据所述当前状态空间嵌入向量得到;表示当前状态下所采取的动作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门理工学院,其通讯地址为:361024 福建省厦门市集美区理工路600号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。