武汉大学李治江获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉大学申请的专利基于知识引导的伪装目标检测方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120070855B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510097090.9,技术领域涉及:G06V10/25;该发明授权基于知识引导的伪装目标检测方法和系统是由李治江;陈泽锋;薛运其;张莉设计研发完成,并于2025-01-22向国家知识产权局提交的专利申请。
本基于知识引导的伪装目标检测方法和系统在说明书摘要公布了:本发明公开了基于知识引导的伪装目标检测方法和系统,实现了对伪装目标的高质量分割并降低对训练数据的依赖。本发明方法利用多模态大语言模型为伪装图像生成知识描述,通过高度抽象和概括的知识表示,增强模型对语义目标和伪装场景的理解能力。其中,多层次知识聚合模块聚合多层次文本描述中的一致性信息,形成多层次的语义知识矢量,抑制错误描述带来的噪声干扰以及过度丰富的文本描述使得模型特征失焦。为了将语义知识整合到视觉基础模型中,知识引导的语义增强适配器模块通过冻结基础模型原有参数,在低秩空间内运用语义知识引导调整图像视觉特征表征,在集成伪装图像的语义知识的同时保持视觉模型的通用知识和分割能力。
本发明授权基于知识引导的伪装目标检测方法和系统在权利要求书中公布了:1.一种基于知识引导的伪装目标检测方法,其特征在于,包括以下步骤: 步骤1,数据集构建:选择伪装目标数据集,将数据集分为训练集、验证集和测试集; 步骤2,利用定义的任务指令查询多模态大语言模型,提取多层次语义知识描述; 步骤3,构建伪装目标检测模型,具体处理过程为:通过文本编码器将多层次语义知识描述编码为描述矢量,然后利用多层次知识聚合模块将描述矢量输入多层次知识聚合模块中聚合成多层次知识矢量,通过若干个知识引导的语义增强适配器模块与视觉基础模型中的编码层的并行块对多层次知识矢量进行语义引导,得到语义增强后的图像特征,最后经过视觉基础模型中的解码层解码输出预测掩码; 多层次知识聚合模块的具体处理过程如下:以、、、、、分别表示类别、数量、颜色、纹理、形状和环境六个嵌入后的描述矢量,将类别和数量矢量拼接以获得整幅图像的完整类别信息,经过一层多层感知机聚合为类别知识矢量;将类别描述信息分别与颜色、纹理、形状描述相乘以强化一致性信息,抑制非一致噪声信息的干扰,经sigmoid激活函数激活后进行整合,经多层感知机最终聚合为目标知识矢量;从环境描述信息中去除类别描述信息排除目标语义信息的影响,经多层感知机整合为环境知识矢量; 知识引导的语义增强适配器模块的具体处理过程如下: 对输入特征进行投影,使投影特征分别强调不同层次的语义信息,经过11卷积将特征映射到低秩空间,通过两个33卷积恢复局部细节,增强不同语义级别的特征表示,从而获得类别知识引导后的增强特征、目标知识引导后的增强特征、背景知识引导后的增强特征,其中、、分别表示聚合后的类别、目标和环境三个层次的知识矢量;将类别与目标知识引导下的增强特征、相加并经过两个33卷积以融合全局语义特征和目标细节特征,得到;将增强特征同背景知识引导下的特征拼接以整合前景与背景的差异表征,经过11卷积调整通道,利用通道注意力和空间注意力强化前景背景的区别; 步骤4,将训练集中的训练图像和相应的知识描述输入伪装目标检测模型,利用训练图像的标注进行监督训练,在验证集上测试性能,保存在验证集上表现最佳的模型; 步骤5,将测试集中的测试图像和相应的知识描述输入到表现最佳的模型,模型预测伪装目标输出分割掩码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉大学,其通讯地址为:430072 湖北省武汉市武昌区八一路299号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励