华南理工大学张怀东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利基于视觉问答模块和颜色掩码的同类物体识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118674909B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410715006.0,技术领域涉及:G06V10/22;该发明授权基于视觉问答模块和颜色掩码的同类物体识别方法是由张怀东;石晓龙;张皓泉设计研发完成,并于2024-06-04向国家知识产权局提交的专利申请。
本基于视觉问答模块和颜色掩码的同类物体识别方法在说明书摘要公布了:本发明公开了一种基于视觉问答模块和颜色掩码的同类物体识别方法,包括:使用者输入图像,对图像中的所有物体进行标注,获得所有物体的名称;指定出视觉问题的主体;在视觉问题中标注占位符;替换占位符得到新视觉问题;将视觉问题和图像输入到视觉问答模块来获得候选答案;使用不同颜色对候选答案进行上色;将带有颜色的物体名称对视觉问题的占位符再次进行替换,再次得到新的视觉问题;将最新的视觉问题和被上色的图像输入到视觉问答模块中,得到视觉问题的最终答案。本发明能够有效区分识别场景中属于同一类别的物体。
本发明授权基于视觉问答模块和颜色掩码的同类物体识别方法在权利要求书中公布了:1.基于视觉问答模块和颜色掩码的同类物体识别方法,其特征在于,包括以下步骤: S1:对图像中的所有物体进行标注,获得所有物体的名称; S2:在获得的所有物体名称中,指定出视觉问题的主体,称为问题主体; 对问题主体进行指定,将主体边界框b覆盖到问题主体上,覆盖的过程定义为得到带有主体框的图像ib,公式表达如下: 式中,代表输入的图像; S3:对视觉问题做出修改,标记属于物体名称的占位符; 对视觉问题Q做出修改,根据主谓宾关系,将视觉问题的问题主体对应的主语或宾语标记为占位符,修改后得到视觉问题Q1; S4:将所有物体名称依次填入被修改过的视觉问题的占位符中,得到包含不同物体名称的视觉问题; 用物体名称集合A={a1,a2,...,an}中的物体名称替换Q1中的占位符,得到新的视觉问题 S5:将包含不同物体名称的视觉问题和图像输入到视觉问答模块中,得到各个物体与问题主体间的置信度得分,选择最高置信度得分的物体作为候选答案; 使用CLIP模型进行零样本视觉问答,将视觉问答的过程表示为Mvqa,依次将问题和图像ib输入到视觉问答模块中,得到物体与问题主体间的置信度得分选择最高置信度得分然后执行以下过程:从最高置信度得分反推到其对应的问题,再将问题中的物体名称作为候选答案A*,将这个过程定义为MgetN,公式表达如下: S6:使用不同颜色对图像中的各个候选答案进行上色,得到带有颜色修饰的候选答案; S7:将带有颜色修饰的候选答案依次填入被修改过的视觉问题的占位符中,得到多个包含不同颜色但是相同候选答案的视觉问题; S8:将包含不同颜色但是相同候选答案的视觉问题和被上色的图像输入到视觉问答模块中,得到不同颜色的候选答案与问题主体之间的置信度得分,选择置信度得分最高的那个颜色的候选答案作为视觉问题的最终答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励