Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民大学窦志成获国家专利权

中国人民大学窦志成获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民大学申请的专利一种基于蒙特卡洛树与动态检索的多模态推理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119808941B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411826230.3,技术领域涉及:G06N5/04;该发明授权一种基于蒙特卡洛树与动态检索的多模态推理方法是由窦志成;董冠霆;张宬浩;邓梦洁;朱余韬;文继荣设计研发完成,并于2024-12-12向国家知识产权局提交的专利申请。

一种基于蒙特卡洛树与动态检索的多模态推理方法在说明书摘要公布了:本公开提供一种基于蒙特卡洛树与动态检索的多模态推理方法。应用于人工智能助手辅助教师判卷场景。具体来说,本框架包括统一的检索模块:所述检索模块包括混合模态检索语料库和多模态检索模块;所述多模态检索模块包括两种检索模块:文本检索模块和跨模态检索模块,采用知识概念过滤来选择关键的解决问题见解,利用蒙特卡罗树搜索和主动检索机制自动获取多模态推理的渐进式多模态推理注释进行数据标注;然后利用标注数据在两个阶段通过课程过程奖励建模逐步对齐过程奖励模型,以实现对多模态大模型推理的细粒度验证。结合了MCTS算法和主动检索策略,以改善多模态推理。该框架能够自动获取高质量的逐步推理注释,从而逐步对齐过程奖励模型,最终实现可靠的自动化多模态推理验证。

本发明授权一种基于蒙特卡洛树与动态检索的多模态推理方法在权利要求书中公布了:1.一种基于蒙特卡洛树与动态检索的多模态推理方法,其特征在于,应用于辅助教师判卷场景,输入待审阅的试卷内容,应用包括检索模块的检索模型,获得与试卷内容匹配的试卷答案内容; 所述检索模块包括混合模态检索语料库和多模态检索模块; 所述多模态检索模块包括两种检索模块:文本检索模块和跨模态检索模块,采用知识概念过滤来选择关键的解决问题见解,利用蒙特卡罗树搜索和主动检索机制自动获取多模态推理的渐进式多模态推理注释进行数据标注;然后利用标注数据在两个阶段通过课程过程奖励建模逐步对齐过程奖励模型,以实现对多模态大模型推理的细粒度验证; 所述文本检索模块的实现方法为:给定一个多模态样本的文本查询q,使用 Contriever来获取查询和文档的隐藏向量,相关性评分通过计算查询和文档表示之间的点积相似度来得出,具体如下:; 所述跨模态检索模块的实现方法为:使用CLIP 编码图像‑文本对 x, t,获得图像向量 和文本向量,推导整个混合模态语料库的编码向量,如下所示: 其中,表示空集,对于第 i 个多模态查询,将其编码为混合向量 ; 在每个多模态查询的编码与整个检索数据库之间进行跨模态检索,利用 FAISS 进行索引,以便为每个查询检索 K 个样本:; 所述知识概念过滤的方法为:给定一个多模态查询 及其知识概念标签 ,对从混合模态检索库 中检索到的前 K 个混合模态样本进行编码,并计算与知识概念表征的相似度:,执行原始检索相似度阈值  和知识概念一致性阈值 ,仅允许那些同时满足这两个标准的样本作为查询 的关键见解 ,其中 代表向量之间的余弦相似度; 所述渐进式多模态推理注释的实现方式为:在每个节点获取 Q 值,以捕捉中间步骤中的潜在推理错误,包括四个核心操作: 选择操作:在第 j 次模拟中,过程从s0开始,表示包含多模态输入查询和相应检索到的问题解决见解 r0初始状态,通过迭代选择探索蒙特卡罗树,将状态 sj 的多模态查询表示为: 其中为第i步的推理步骤; 扩展与主动检索策略:给定由所选叶节点表示的状态 si,基于蒙特卡罗树搜索的方法回溯到先前状态,形成推理过程,多模态输入表示为,在扩展阶段首先将多模态输入与之前的推理步骤进行连接,然后根据需要动态检索每一步的候选的解题见解,并用最新检索到的见解替换前一步的见解; 仿真操作:使用基于部分解决方案推断正确答案的概率作为质量评估的标准,对每个扩展过程中获得的节点应用一步滚动,并构建价值函数: 其中表示采样的推理路径数,是指示函数,如果最终答案等于基准真值 ,将当前节点的值设为1;否则设为0; 反向传播操作:对于在滚动过程中到达的终端节点和当前叶节点,蒙特卡罗树搜索对从当前节点到根节点路径上的每个 s, a 进行回传更新: ;其中代表代表状态,即蒙特卡洛树的节点,代表动作,即模型采样行为,则代表二者的访问计数,代表二者的动作价值,代表对于状态的价值函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民大学,其通讯地址为:100872 北京市海淀区中关村大街59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。