广东海洋大学刘洺辛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广东海洋大学申请的专利基于多模态融合的水下图像目标检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121482380B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610025877.9,技术领域涉及:G06V10/25;该发明授权基于多模态融合的水下图像目标检测方法及系统是由刘洺辛;郑志飞;李瑞鑫;钟行;吴宇杰;林聪设计研发完成,并于2026-01-09向国家知识产权局提交的专利申请。
本基于多模态融合的水下图像目标检测方法及系统在说明书摘要公布了:本发明涉及水下目标检测技术领域,具体涉及一种基于多模态融合的水下图像目标检测方法及系统;方法包括:获取水下光学图像和声呐图像对以及训练好的水下多模态目标检测网络;将图像对输入所述网络,通过双分支骨干网络分别提取光学模态与声呐模态的多尺度特征;通过多模态特征对齐模块利用注意力机制与置信掩码计算跨模态特征偏移量,实现声光特征的空间自适应对齐;通过跨模态特征融合模块采用多头缩放点积注意力与并行双门控结构,自适应筛选并融合双模态互补特征,增强目标特征表示;将融合后的特征送入检测颈部与头部完成目标分类与定位。本发明解决了水下声光模态空间错位与成像差异问题,提升了复杂水下环境中目标检测的精度与鲁棒性。
本发明授权基于多模态融合的水下图像目标检测方法及系统在权利要求书中公布了:1.一种基于多模态融合的水下图像目标检测方法,其特征在于,所述方法包括以下步骤: S100,获取水下光学图像、声呐图像对以及训练好的水下多模态目标检测网络,所述水下多模态目标检测网络包含双分支骨干网络、多模态特征对齐模块、跨模态特征融合模块以及检测颈部与检测头部; S200,将所述光学图像与声呐图像分别输入所述双分支骨干网络,提取多尺度的光学特征图与声呐特征图; S300,针对每一对应尺度的光学特征图与声呐特征图,通过所述多模态特征对齐模块计算跨模态特征偏移量,并基于所述跨模态特征偏移量对声呐特征图进行空间对齐校正,得到对齐后的声呐特征图; S400,将所述光学特征图与对齐后的声呐特征图输入所述跨模态特征融合模块,通过多头缩放点积注意力机制建立跨模态长程依赖关系,并采用并行双门控结构自适应筛选与融合双模态互补特征,输出增强的融合特征图; S500,将所述增强的融合特征图送入所述检测颈部进行多尺度特征聚合,再通过所述检测头部完成目标的分类与边界框回归,得到最终的水下目标检测结果; S300中,所述通过所述多模态特征对齐模块计算跨模态特征偏移量,包括: S310,将所述光学特征图与声呐特征图经由三组独立的线性投影映射到统一的查询-键-值空间,输出光学特征序列与声呐特征序列; S320,计算光学查询与声呐键的逐token相似度矩阵,对该相似度矩阵进行Softmax归一化处理得到对齐权重矩阵,将该对齐权重矩阵作用于声呐特征生成的值向量,得到初步对齐后的声呐特征; S330,计算所述初步对齐的声呐特征与原声呐特征序列的差值作为差异残差,将所述差异残差通过残差连接输入双层前馈网络进行偏移误差校正,并乘以自适应学习的尺度因子,生成初步对齐特征偏移量; S340,将所述光学特征图与声呐特征图拼接后输入两层全连接多层感知器进行特征精炼,输出置信掩码,将所述初步对齐特征偏移量与该置信掩码逐元素相乘,得到跨模态特征偏移量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东海洋大学,其通讯地址为:524088 广东省湛江市麻章区海大路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励