江南大学徐天阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江南大学申请的专利一种基于稀疏超图的跨文档问答方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121412280B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512023875.4,技术领域涉及:G06F16/2455;该发明授权一种基于稀疏超图的跨文档问答方法及系统是由徐天阳;梁振阳;吴小俊设计研发完成,并于2025-12-30向国家知识产权局提交的专利申请。
本一种基于稀疏超图的跨文档问答方法及系统在说明书摘要公布了:本发明公开了一种基于稀疏超图的跨文档问答方法及系统,涉及知识图谱技术领域,该方法包括:构建初始超图索引,将文档片段作为超边并连接其内所有实体;提取实体三元组,根据实体出现频次区分桥接实体与局部实体;对超图进行稀疏化处理,保留所有与桥接实体相关的2跳路径内实体,剪枝冗余局部实体,生成稀疏超图知识库;将该知识库中的2跳路径转换为自然语言问题并向量化,构建路径问题向量库;接收用户查询后,先尝试通过匹配路径问题向量库直接回答;若无法直接回答,则将复杂查询分解为最小单跳子问题集合,并依据子问题间的依赖关系,迭代检索稀疏超图中的超边与三元组以生成答案。本发明有效提升了跨文档多跳问答的准确率与推理效率。
本发明授权一种基于稀疏超图的跨文档问答方法及系统在权利要求书中公布了:1.一种基于稀疏超图的跨文档问答方法,其特征在于,包括以下步骤: 步骤S1:构建初始超图索引,将原始文档片段作为超边,所述超边连接该文档片段内提取的所有实体; 步骤S2:提取文档片段内的实体三元组,并根据实体在文档集合中的分布情况,区分桥接实体和局部实体,包括: 步骤S21:采用预定义的提示词结合少样本示例,引导大语言模型输出结构化文本,再利用正则表达式从所述结构化文本中提取三元组,所述三元组的形式为,其中和分别为头实体和尾实体,为语义关系,为提取置信度; 步骤S22:利用Embedding模型计算同一文档内各实体的向量表示并计算余弦相似度,将相似度高于预设阈值的实体作为候选对,通过大语言模型结合实体属性和上下文描述进行二次判定,若为同一实体则合并并统一实体ID; 步骤S23:设全量超边集合为,计算任意实体在超边集合中出现的频次,若则定义为桥接实体,若则定义为局部实体,其中表示超边,表示超边是全量超边集合中的元素,表示实体是超边所连接的实体节点集合中的元素; 步骤S3:对初始超图进行稀疏化处理,保留所有连接到桥接实体的2跳路径内的实体,剪枝去除其余局部实体,生成具备超图结构和普通图谱结构的稀疏超图知识库; 步骤S4:聚合稀疏超图知识库中的2跳关系路径,将其转换为自然语言形式的路径问题,并构建路径问题向量库; 步骤S5:接收用户查询,计算用户查询与路径问题向量库的相似度,若召回路径能够回答问题则直接输出最终答案; 步骤S6:若召回路径未能回答问题,将用户查询分解为由单跳子问题组成的最小集合; 步骤S7:根据子问题间的依赖关系迭代解决子问题,检索上下文回答前置子问题,利用前置子问题的答案重写上下文依赖的后续子问题,基于重写后的子问题在稀疏超图知识库中联合检索相关三元组和超边以生成答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江南大学,其通讯地址为:214122 江苏省无锡市滨湖区蠡湖大道1800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励