Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳市明心数智科技有限公司何中卿获国家专利权

深圳市明心数智科技有限公司何中卿获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳市明心数智科技有限公司申请的专利基于大语言模型的小语种网页自适应采集方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121658699B

龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610163415.3,技术领域涉及:G06F16/951;该发明授权基于大语言模型的小语种网页自适应采集方法及装置是由何中卿;曾伟嘉;陈大伟;王学腾;徐凌子;徐坤扬;赵山;谢琼冰设计研发完成,并于2026-02-05向国家知识产权局提交的专利申请。

基于大语言模型的小语种网页自适应采集方法及装置在说明书摘要公布了:本申请涉及人工智能技术领域,公开了一种基于大语言模型的小语种网页自适应采集方法及装置,其中方法包括:通过无头浏览器加载并渲染目标小语种网页,获取文档对象模型树结构;基于大语言模型对文档对象模型树结构进行解析和语义标注,识别动态内容节点并生成自适应内容定位规则;基于自适应内容定位规则,对连续采集的至少两个网页内容进行语义向量化,并计算语义相似度;根据语义相似度查询预设的频率映射规则,动态调整后续采集请求的发起频率,生成采集策略;执行采集策略以访问目标网页,并在采集过程中注入用于模拟人类交互行为的操作序列。本申请能够实现小语种网页动态内容的完整采集,并保障采集过程的连续稳定。

本发明授权基于大语言模型的小语种网页自适应采集方法及装置在权利要求书中公布了:1.一种基于大语言模型的小语种网页自适应采集方法,其特征在于,包括: 通过无头浏览器加载并渲染目标小语种网页,获取对应的文档对象模型树结构; 将所述文档对象模型树结构输入至预训练的多语言大语言模型;通过所述大语言模型获取所述文档对象模型树中节点的结构化描述和语义标注信息,所述语义标注信息至少包括节点功能类别和内容语言标签;根据所述结构化描述和所述语义标注信息,识别与动态内容加载相关的目标节点;基于所述目标节点的路径信息和属性特征,生成或更新用于定位目标节点内容的自适应内容定位规则; 基于所述自适应内容定位规则,对连续采集的至少两个网页内容进行语义向量化,并计算对应的语义相似度; 根据所述语义相似度查询预设的频率映射规则,动态调整后续采集请求的发起频率,生成采集策略; 执行所述采集策略以访问目标网页,并在采集过程中注入用于模拟人类交互行为的操作序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市明心数智科技有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋B5001;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。