南京邮电大学鲍秉坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于答案引导的视觉常识推理去偏方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119398174B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411533851.2,技术领域涉及:G06N5/04;该发明授权一种基于答案引导的视觉常识推理去偏方法及系统是由鲍秉坤;邹佳怡;贾耕云设计研发完成,并于2024-10-31向国家知识产权局提交的专利申请。
本一种基于答案引导的视觉常识推理去偏方法及系统在说明书摘要公布了:本发明公开了一种基于答案引导的视觉常识推理去偏方法及系统,涉及视觉常识推理技术领域,包括以下步骤:获取图片与原始文本,将图片与原始文本进行配对,得到负样本,提取负样本内图片和问题以及答案文本;将图片和问题输入至预先建立的图片编码器内,输出得到图片编码特征,将答案文本输入至预先建立的文本编码器内,输出得到文本编码特征,将图片编码特征和文本编码特征通过单模态特征处理以及模态间特征融合,得到多模态特征;接收视觉常识推理数据集,抽取视觉常识推理数据集内的正确候选答案,生成去偏特征样本集,提取去偏特征样本集内特征,作为答案特征;将多模态特征与答案特征经过注意力机制,计算得到融合特征,基于融合特征计算得出候选答案的概率,将候选答案的概率最高的候选答案作为预测答案。
本发明授权一种基于答案引导的视觉常识推理去偏方法及系统在权利要求书中公布了:1.一种基于答案引导的视觉常识推理去偏方法,其特征在于,方法包括以下步骤: 获取图片与原始文本,将图片与原始文本进行配对,得到负样本,提取负样本内图片和问题以及答案文本; 将图片和问题输入至预先建立的图片编码器内,输出得到图片编码特征,将答案文本输入至预先建立的文本编码器内,输出得到文本编码特征,将图片编码特征和文本编码特征通过单模态特征处理以及模态间特征融合,得到多模态特征; 接收视觉常识推理数据集,抽取视觉常识推理数据集内的正确候选答案,生成去偏特征样本集,提取去偏特征样本集内特征,作为答案特征; 将多模态特征与答案特征经过注意力机制,计算得到融合特征,基于融合特征计算得出候选答案的概率,将候选答案的概率最高的候选答案作为预测答案; 所述基于融合特征计算得出候选答案的概率,将候选答案的概率最高的候选答案作为预测答案的过程: 在Q→A任务中,预测答案概率为,预测答案为; 在QA→R任务中,预测推理概率为,预测推理为; 对于得到的负样本对应的融合特征,不与答案特征融合,直接进行答案预测;最终的结果输入到损失函数中作为一种约束使得完整的模型关注图片的正确部分; 训练的损失函数为交叉熵损失,在Q→A表示为,在QA→R表示为,其中表示候选集合中正确的候选答案,负样本对应的预测损失在Q→A中为,在QA→R中为; 最终,引入参数λ来平衡正常样本和负样本的训练损失,表示为。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励