合肥大智慧财汇数据科技有限公司冯卫强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥大智慧财汇数据科技有限公司申请的专利跨格式文档信息的溯源定位方法、系统、终端及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121210737B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511756202.3,技术领域涉及:G06F16/93;该发明授权跨格式文档信息的溯源定位方法、系统、终端及介质是由冯卫强;张友豪;陈丹丹;左明明;吴彦儒设计研发完成,并于2025-11-27向国家知识产权局提交的专利申请。
本跨格式文档信息的溯源定位方法、系统、终端及介质在说明书摘要公布了:本发明涉及信息检索与处理技术领域,公开了跨格式文档信息的溯源定位方法、系统、终端及介质。该方法将不同格式的文档内容分解为具有位置信息的标准化要素块及元素块,并构建统一的存储模型,从而生成相应的文件预转结果;基于所述文件预转结果,将待定位的信息抽取结果进行向量化,通过在向量数据库中执行语义相似度检索以生成候选要素块集合,在此基础上结合候选要素块及其关联的元素块,执行文本相似度与实体相似度的精细化匹配,从而确定所述信息抽取结果在原始文档中的精确位置;本发明可有效实现跨格式文档的统一位置感知建模,消除定位盲区。
本发明授权跨格式文档信息的溯源定位方法、系统、终端及介质在权利要求书中公布了:1.跨格式文档信息的溯源定位方法,其特征在于,包括以下步骤: S1.将不同格式的文档内容分解为具有位置信息的标准化要素块及元素块,并构建统一的存储模型,从而生成相应的文件预转结果; S2.基于所述文件预转结果,将待定位的信息抽取结果进行向量化,通过在向量数据库中执行语义相似度检索以生成候选要素块集合,在此基础上结合候选要素块及其关联的元素块,执行文本相似度与实体相似度的精细化匹配,从而确定所述信息抽取结果在原始文档中的精确位置; 步骤S2中,候选要素块集合的生成方法包括以下步骤: S211.判断当前文档是否已经向量化且存在于向量数据库中,是则直接执行步骤S214,否则执行步骤S212; S212.从文件预转结果中获取所有要素块文本信息,并保持顺序,将要素块按顺序交叠形成文档切割结果; S213.将文档切割结果进行向量化,并将向量化结果灌入向量数据库,封装检索接口; S214.将信息抽取结果进行向量化嵌入,得到查询信息块,在向量数据库中进行相似度检索,若相似度大于设定阈值,检索出与查询信息块在语义层面最相似的若干个候选要素块及其关联的位置标签;若所有要素块对应的相似度均不大于设定阈值,则判定无法定位; S215.将步骤S214的检索结果结合提示词,调用大模型优化候选要素块集合; 所述精细化匹配的方法包括以下步骤: S221.在步骤S215优化后的候选要素块集合中,根据文件预转结果找到每个候选要素块对应的所有元素块信息; S222.获取候选要素块集合的精细化范围: S2221.计算查询信息块文本内容与候选要素块内容之间的字符文本相似度; S2222.识别并提取查询信息块和候选要素块中的关键命名实体,并计算两者之间实体集合的相似度; S2223.对步骤S2221的文本相似度得分和步骤S2222的实体相似度得分进行加权得到第一综合评分,选择第一综合评分大于设定分值的候选要素块作为最终匹配的精确要素块,并获取该精确要素块关联的元素块集合作为候选元素块集合,随后执行步骤S223;若所有候选要素块的第一综合评分均不大于设定分值,则执行步骤S2224; S2224.将所有候选要素块结合提示词,通过大模型给出最优要素块,获取该最优要素块关联的元素块集合作为候选元素块集合,若无结果,则选择第一综合评分最高的要素块作为最优结果,并获取最优结果所关联的元素块集合作为候选元素块集合,随后执行步骤S223; S223.获取候选元素块集合的精细化范围: S2231.计算查询信息块文本内容与候选元素块内容之间的字符文本相似度; S2232.识别并提取查询信息块和候选元素块中的关键命名实体,并计算两者之间实体集合的相似度; S2233.对步骤S2231的文本相似度得分和步骤S2232的实体相似度得分进行加权得到第二综合评分,选择第二综合评分大于设定分值的候选元素块作为最终匹配的精确元素块,存入定位结果,随后执行步骤S2235;若所有候选元素块的第二综合评分均不大于设定分值,则执行步骤S2234; S2234.将所有候选元素块结合提示词,通过大模型给出最优元素块,若无结果,则选择第二综合评分最高的元素块作为最优结果,存入定位结果,随后执行步骤S2235; S2235.输出定位结果,当定位结果非空,该结果为最终定位结果,否则提示该数据无法定位。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥大智慧财汇数据科技有限公司,其通讯地址为:230000 安徽省合肥市蜀山区望江西路99号安高城市广场办2402室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励