中国人民解放军63921部队王得成获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军63921部队申请的专利一种针对结构化长文档的问答方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119848223B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510336343.3,技术领域涉及:G06F16/3329;该发明授权一种针对结构化长文档的问答方法及系统是由王得成;张一;郭子瑜;赵志浩;陈曦设计研发完成,并于2025-03-21向国家知识产权局提交的专利申请。
本一种针对结构化长文档的问答方法及系统在说明书摘要公布了:本发明涉及大语言模型技术领域,具体为一种针对结构化长文档的问答方法,包括以下步骤:S1、解析不同格式的文档,根据解析结果构建文档的结构化元数据;S2、将文档划分成多个文本片段,对每个文本片段进行向量化处理,并存储在专用的向量数据库中;S3、分别构建多个文本内容获取工具,用于提取文档中不同部分的文本内容;设计并实现基于向量的检索工具,用于在向量数据库中查找与用户查询相关的文本片段;S4、构建包含多个文本内容获取工具和检索工具的Agent,针对用户问题智能选择文本内容获取工具或检索工具以获取LLM回答问题所需要的相关文本内容;S5、在获取相关文本内容后,通过LLM通过对相关文本内容进行分析,生成最终回答。
本发明授权一种针对结构化长文档的问答方法及系统在权利要求书中公布了:1.一种针对结构化长文档的问答方法,其特征在于,包括以下步骤: S1、解析不同格式的文档,根据解析结果构建文档的结构化元数据; S2、将文档划分成多个文本片段,对每个文本片段进行向量化处理,并存储在专用的向量数据库中; S3、分别构建多个文本内容获取工具,用于提取文档中不同部分的文本内容;设计并实现基于向量的检索工具,用于在向量数据库中查找与用户查询相关的文本片段; S4、构建包含多个文本内容获取工具和检索工具的Agent,针对用户问题智能选择文本内容获取工具或检索工具以获取LLM回答问题所需要的相关文本内容; S5、在获取相关文本内容后,通过LLM通过对相关文本内容进行分析,生成最终回答; 步骤S4中所述的构建包含上述工具的Agent包括: S41、利用ReAct框架构建包含多个文本内容获取工具和检索工具的Agent; S42、Agent通过LLM对用户的问题进行语义解析,识别出问题的核心信息和结构需求; S43、Agent根据语义解析结果,动态选择工具以完成信息获取,当用户提问包含页面编号、章节标题层级、表格标识或图像标识结构化特征时,Agent将智能选择对应的页面提取工具、章节提取工具、表格提取工具或图像提取工具;对于非结构化语义查询,则选择基于向量的检索工具,通过文本嵌入模型实现语义空间的精准匹配; S44、Agent调用相应的文本内容获取工具或检索工具从文档中提取相关内容,如果用户的问题涉及多个部分,Agent会在不同工具之间切换并整合信息; 所述ReAct框架包括: 通过语言模型空间L增强原始的动作空间A,加强的动作空间; 针对来自语言模型空间的动作,Agent会基于当前环境进行推理得到有用信息,进而支持后续的推理和动作执行;基于权重固化的语言模型,采用在提示词中给出工具定义以及解决问题的示例来生成解决问题的thought和action序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军63921部队,其通讯地址为:100094 北京市海淀区5131信箱;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。