中央民族大学沙九获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中央民族大学申请的专利融合多模态大语言模型与RAG机制的图文报告生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120995994B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511527490.5,技术领域涉及:G06F40/166;该发明授权融合多模态大语言模型与RAG机制的图文报告生成方法是由沙九设计研发完成,并于2025-10-24向国家知识产权局提交的专利申请。
本融合多模态大语言模型与RAG机制的图文报告生成方法在说明书摘要公布了:本发明公开了融合多模态大语言模型与RAG机制的图文报告生成方法,属于文本处理技术领域。所述方法首先将PDF文档转为图像,通过多模态模型识别并提取文本、表格、图表等内容,构建可检索的知识片段库;接着基于用户查询,采用混合检索策略获取相关证据,并利用大语言模型生成含图像占位符的Markdown报告;同时调用文生图模块生成配图,最终实现图文融合的可视化报告输出。本发明支持多模态内容理解、跨模态检索与协同生成,具备良好的泛化性、准确性与实用性,适用于多领域、多语种的复杂文档处理与报告生成。
本发明授权融合多模态大语言模型与RAG机制的图文报告生成方法在权利要求书中公布了:1.融合多模态大语言模型与RAG机制的图文报告生成方法,其特征在于,所述方法包括: 步骤1、预处理与知识构建:将输入的PDF文档转换为页面图像序列,利用多模态模型进行版面分析与要素抽取,生成文本、表格及图表描述形式的知识片段,针对每个知识片段,采用文档标识符,页码,位置坐标三元组的形式记录知识片段的来源与位置信息; 步骤2、构建混合检索器:采用文本嵌入模型将所述知识片段向量化,构建同时支持向量相似度检索与关键词匹配的混合检索器; 步骤3、检索与重排:解析用户查询意图,利用所述混合检索器获取相关证据片段集,并基于最大边际相关准则对所述证据片段集进行重排;包括:在保证与查询高相关性的前提下,迭代地选择与已选证据集相似度最低的证据片段;利用轻量级大语言模型对重排后的证据片段集进行质量评分,若质量评分低于预设阈值,执行第二轮检索,将两轮检索结果融合并重排后,形成最终证据集; 步骤4、图文协同生成:依据重排后的证据片段集生成配图说明与图像占位符,采用大语言模型生成内含所述图像占位符和证据来源声明的Markdown格式报告草案;包括:系统首先根据证据片段集中的结构化数据要点生成详细的配图说明文本,随后将配图说明文本描述输入文生图模块,生成与报告内容语义一致的可视化图表;从所述Markdown格式报告草案中提取关键事实陈述,将其与知识库中的原始证据进行语义相似度匹配与风险判定,并对存在背离风险的陈述进行标记或修订,所述关键事实陈述包括数值数据、时间信息、实体关系断言及核心结论性描述; 步骤5、引用绑定与渲染输出:对所述报告草案中的报告段落单元与知识库中的知识片段进行向量相似度计算与阈值判定,若所述余弦相似度值超过预设阈值,则为该报告段落单元绑定对应的知识片段作为引用来源;经一致性校验和术语统一后,渲染输出最终的图文报告。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中央民族大学,其通讯地址为:100081 北京市海淀区中关村南大街27号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励