Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京农业大学三亚研究院席瑞获国家专利权

南京农业大学三亚研究院席瑞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京农业大学三亚研究院申请的专利基于AI大模型的植保领域文献信息批量结构化提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121210586B

龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511786361.8,技术领域涉及:G06F16/31;该发明授权基于AI大模型的植保领域文献信息批量结构化提取方法是由席瑞;王亚坤;祝增荣;周瀛设计研发完成,并于2025-12-01向国家知识产权局提交的专利申请。

基于AI大模型的植保领域文献信息批量结构化提取方法在说明书摘要公布了:本发明公开一种基于AI大模型的植保领域文献信息批量结构化提取方法,属于计算机数据处理与人工智能应用技术领域,本发明方法通过PDF文献自适应预处理模块与Markdown转换模块,将PDF格式文献转换为Markdown格式文本;接着,采用双策略自适应AI提取模块,根据文本长度阈值采用不同的方式处理,并结合JSON格式数据修复策略提取JSON数据;然后,通过两阶段并行调度模块并行处理CPU密集型转换任务和IO密集型AI分析任务,还通过多维聚合导出模块,根据预定义的映射规则聚合生成结构化数据库文件。本发明实现从文献获取到结构化数据输出的端到端自动化,解决人工阅读文献信息提取效率低下的问题。

本发明授权基于AI大模型的植保领域文献信息批量结构化提取方法在权利要求书中公布了:1.一种基于AI大模型的植保领域文献信息批量结构化提取方法,其特征在于,基于Python语言的IDE运行平台,通过一个多阶段、并行化的处理流程,实现从PDF格式文献到结构化数据输出的端到端自动化流程,处理流程包括如下: S1,构建PDF文献自适应预处理模块与Markdown转换模块,获取PDF格式文献,基于智能PDF文本提取重构阅读文本流,通过文本深度清洗、结合语义结构识别与段落重构以及幂等性缓存策略,将文献批量转换为具有语义层级结构、适合计算机处理的Markdown格式文本,实现从视觉化非结构化格式向语义化结构化格式的转换; S2,构建双策略自适应AI提取模块,将所述Markdown格式文本输入AI模块,依据文本长度阈值在分阶段提取策略与智能分块提取策略间自适应切换,通过聚焦专业Prompt指令执行提取JSON格式数据策略;所述AI模块并包括对JSON格式数据实施高鲁棒性JSON格式数据修复策略以获得可解析的结构化JSON格式数据; 所述S2中,通过双策略自适应AI提取模块,依据文本长度与结构复杂度在分阶段提取策略与智能分块提取策略间自适应切换,具体过程如下: 设置一个文本长度阈值作为决策点;Markdown格式文本输入后,首先检查Markdown格式文本的长度:若文本长度阈值,判定为标准长度文本,启动分阶段提取策略;若文本长度阈值,判定为超长长度文本,启动智能分块提取策略; 1分阶段提取策略:采用任务分解策略,将同一篇Markdown格式文本连续三次输入AI模型中,每次使用不同的聚焦专业Prompt指令,将一个任务分解为三个聚焦关注点不同的子任务中,具体如下: 阶段一:提取“基础信息与章节”,此阶段指令识别Markdown格式文本的元数据; 阶段二:提取“专业因子”,此阶段指令识别Markdown格式文本中的专业领域实体; 阶段三:提取“定量数据与方法”,此阶段指令识别Markdown格式文本的方法与结果上; 最后,分别将三个阶段的结果调用返回为JSON格式数据并在本地内存中储存,将这三个JSON格式数据进行合并,去除重复项并统一格式,最终形成一个包含所有目标字段的、完整的JSON格式数据; 2智能分块提取策略:采用语义对齐分块策略,利用Markdown格式文本中的章节边界作为语义分割单元,将超长长度文本分割为多个逻辑连贯的文本块;根据每个文本块的名称,动态匹配聚焦专业Prompt指令并对文本块进行遍历,接着对每个文本块独立调用AI模型进行信息提取,提取得到零散的JSON格式数据,将所有返回的、分布于不同块中的零散JSON格式数据整合合并,形成完整JSON格式数据; S3,构建两阶段并行调度模块,分别用于执行所述步骤S1的CPU密集型转换任务与用于执行所述步骤S2的IO密集型AI分析任务;构建多维聚合导出模块,将生成的所述结构化JSON格式数据根据预定义的映射规则聚合,生成多维度的结构化数据库文件,并输出自适应与本地化的格式,实现从零散提取结果向可分析数据集的高效整合。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京农业大学三亚研究院,其通讯地址为:572025 海南省三亚市崖州区崖州湾科技城雅布伦产业园一号楼四楼401区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。