杭州高新区(滨江)区块链与数据安全研究院;浙江大学李环获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州高新区(滨江)区块链与数据安全研究院;浙江大学申请的专利多智能体协同的多模态推理方法、装置、电子设备和产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120725166B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511251609.0,技术领域涉及:G06F40/194;该发明授权多智能体协同的多模态推理方法、装置、电子设备和产品是由李环;骆歆远;潘嘉骏;陈刚;寿黎但;陈珂设计研发完成,并于2025-09-03向国家知识产权局提交的专利申请。
本多智能体协同的多模态推理方法、装置、电子设备和产品在说明书摘要公布了:本申请涉及人工智能技术领域,提出一种多智能体协同的多模态推理方法、装置、电子设备和计算机程序产品。该方法设置了文本推理智能体、视觉理解智能体和判断型智能体共三个智能体,其中,文本推理智能体主导整体的文本逻辑推理,视觉理解智能体负责提供视觉语义信息,判断型智能体负责评估多模态推理的过程是否需要补充额外的视觉语义信息,并在需要补充的情况下触发视觉信息补充流程,引导视觉理解智能体提取所需补充的视觉语义信息。利用三个智能体的协同工作,形成了多模态推理、补充判断和信息补充的闭环机制,在无需执行复杂预处理流程的基础上,能够对多模态文档进行深度语义理解和逻辑推理,从而实现准确、完整的文档理解与答复文本生成。
本发明授权多智能体协同的多模态推理方法、装置、电子设备和产品在权利要求书中公布了:1.一种多智能体协同的多模态推理方法,其特征在于,包括: 获取与多模态文档相关的用户查询文本; 通过文本推理智能体,根据所述用户查询文本和已生成的所述多模态文档的视觉语义信息进行多模态推理,生成思考推理文本; 通过判断型智能体,根据所述思考推理文本判断所述多模态推理的过程是否缺少支撑信息,且在所述多模态推理的过程缺少支撑信息的情况下生成视觉信息补充指令,并将所述视觉信息补充指令发送至视觉理解智能体; 通过所述视觉理解智能体,在所述视觉信息补充指令的引导下对所述多模态文档的目标页面图像执行视觉语义理解,更新所述视觉语义信息,然后返回执行所述通过文本推理智能体,根据所述用户查询文本和已生成的所述多模态文档的视觉语义信息进行多模态推理,生成思考推理文本的步骤; 其中,所述目标页面图像通过以下方式确定: 获取所述多模态文档的各个原始页面图像; 通过文档编码模型对所述用户查询文本和每个所述原始页面图像进行嵌入表示,分别计算每个所述原始页面图像与所述用户查询文本的相似度得分; 将每个所述原始页面图像与所述用户查询文本的相似度得分由高到低排列,得到降序相似度序列,并将所述降序相似度序列拟合为相似度下降曲线; 构建连接所述相似度下降曲线的两个端点的目标直线; 根据所述相似度下降曲线中每个点与所述目标直线的垂直距离,从所述相似度下降曲线中确定相似度得分急剧下降的转折点; 从所述各个原始页面图像中,选取对应的所述相似度得分高于所述转折点对应的所述相似度得分的页面图像,作为各个相关页面图像; 从所述各个相关页面图像中,确定所述目标页面图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州高新区(滨江)区块链与数据安全研究院;浙江大学,其通讯地址为:310051 浙江省杭州市滨江区物联网孵化器大楼2号楼A楼4-7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励