沪渝人工智能研究院齐鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉沪渝人工智能研究院申请的专利一种基于文件版本关系元信息的问答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119248920B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411401585.8,技术领域涉及:G06F16/3329;该发明授权一种基于文件版本关系元信息的问答方法是由齐鹏;沈国阳;丁建勇;韩一笑;李斌;徐俭设计研发完成,并于2024-10-09向国家知识产权局提交的专利申请。
本一种基于文件版本关系元信息的问答方法在说明书摘要公布了:本发明属于文本问答领域,涉及一种基于文件版本关系元信息的问答方法,该方法包括:获取文件,对文件进行分割处理;对分割后的文件提取重点元信息;根据各个文件的重点元信息构建各个文件之间的关系,并存储在知识库中;将分割后的文件向量化并存储在向量数据库中;获取待问答语句,提取用户问句的上下文时间;采用向量匹配的方式从向量数据库中匹配对应的向量块,并从向量数据库中召回;遍历召回向量块中的原始文件信息,根据原始文件信息得到该文件的上下关系;根据上下文时间采用训练后的大模型对文件的上下关系进行筛选,根据筛选结果对用户的问题进行回答;本发明解决了多版本文件问答时无法正确进行召回的问题,可以更加准确回答问题。
本发明授权一种基于文件版本关系元信息的问答方法在权利要求书中公布了:1.一种基于文件版本关系元信息的问答方法,其特征在于,包括:获取文件,对文件进行分割处理;对分割后的文件提取重点元信息;根据各个文件的重点元信息构建各个文件之间的关系;将文件之间的关系存储在知识库中;将分割后的文件向量化,并将向量化后的数据存储在向量数据库中;获取待问答语句,根据待问答语句的上下文环境提取用户问句的上下文时间;采用向量匹配的方式从向量数据库中匹配对应的向量块,并将匹配的向量块从向量数据库中召回;遍历召回向量块中的原始文件信息,根据上下文时间和原始文件信息得到该文件的上下关系;根据上下文时间采用训练后的大模型对文件的上下关系进行筛选,根据筛选结果对用户的问题进行回答; 对文件进行分割处理包括:设置文本长度阈值;对文件内容进行识别,得到连续的文本字符串以及对应标题关系;对文本字符串进行语义层次识别,并根据对应标题关系对识别后的文本的层级关系进行层次划分,生成文档树,其中文档树的内部节点为层级标题,叶子节点为正文;获取文档树中叶子节点的长度,将叶子节点的长度与文本长度阈值进行对比,若大于设置的文本长度阈值,则采用自然分界字符对叶子节点进行划分,否则不进行处理; 对文件的上下关系进行筛选包括:根据召回的内容查找其对应的元信息;对于每个文本块根据问题以及其问题的上下文时间使用大模型判断其该块是否符合相关关系,不符合则直接过滤;当上下文时间不满足的情况下,则通过版本关系引入该上下文存在的真实法律政策文件;最终针对保留下来的文本块以及其对应的元信息,再次进行重排,选择Top-N结合用户问题以及用户问答历史提供给大模型,大模型对问题生成回答。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沪渝人工智能研究院,其通讯地址为:401329 重庆市沙坪坝区西园北街31号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励