中国科学院自动化研究所马云开获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利隐式问题推理模型的训练方法和隐式问题推理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120409712B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510915797.6,技术领域涉及:G06N5/04;该发明授权隐式问题推理模型的训练方法和隐式问题推理方法是由马云开;周振;范俊峰;张少林;王硕;景奉水设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。
本隐式问题推理模型的训练方法和隐式问题推理方法在说明书摘要公布了:本申请提供了一种隐式问题推理模型的训练方法和隐式问题推理方法,可以应用于人工智能领域,该训练方法包括获取推理训练集;根据场景视频构建目标区域的三维模型;将场景视频和隐式问题输入至视觉语言模型,输出语义特征;将场景视频和语义特征输入至分割基础模型,输出多个掩码图像,掩码图像在与隐式问题对应的多个初始物体上形成有掩膜标签;利用感知融合模型处理多个掩码图像和语义特征,得到目标融合特征;利用预设语言模型处理三维模型、语义特征和目标融合特征,输出推理答案,初始推理模型包括视觉语言模型、分割基础模型、感知融合模型和预设语言模型;根据推理答案和答案标签对初始推理模型的模型参数进行调整,得到目标推理模型。
本发明授权隐式问题推理模型的训练方法和隐式问题推理方法在权利要求书中公布了:1.一种隐式问题推理模型的训练方法,其特征在于,包括: 获取推理训练集,其中,所述推理训练集包括多个训练样本,每个所述训练样本包括目标区域的场景视频和多个场景指令对,所述场景指令对包括针对所述目标区域的多个隐式问题和与每个所述隐式问题对应的答案标签,所述隐式问题为所寻找目标物体的含蓄性表达; 针对每个所述训练样本,根据所述场景视频构建所述目标区域的三维模型; 将所述场景视频和所述隐式问题输入至视觉语言模型,输出语义特征; 将所述场景视频和所述语义特征输入至分割基础模型,输出多个掩码图像,其中,所述掩码图像在与所述隐式问题对应的多个初始物体上形成有掩膜标签; 利用感知融合模型处理多个所述掩码图像和所述语义特征,得到目标融合特征,其中,所述目标融合特征表征多个融合后的多个初始物体; 利用预设语言模型处理所述三维模型、所述语义特征和所述目标融合特征,输出推理答案,初始推理模型包括所述视觉语言模型、所述分割基础模型、所述感知融合模型和所述预设语言模型; 根据所述推理答案和所述答案标签对所述初始推理模型的模型参数进行调整,得到目标推理模型; 其中,所述推理训练集是通过如下方式生成的: 获取所述目标区域的信息集合,其中,所述信息集合包括三维点云和所述场景视频; 将所述三维点云投影至二维图像空间,得到不同视角下的视角图像; 将多个所述视角图像输入至所述分割基础模型,得到对应不同物体的分割掩码标签; 将多个所述视角图像输入至所述视觉语言模型,输出对应不同物体的物体属性标签; 将多个所述视角图像、多个所述分割掩码标签和多个所述物体属性标签输入至所述预设语言模型,输出多个所述场景指令对; 根据所述场景视频和多个所述场景指令对,生成所述推理训练集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励