浙江大学董山玲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于声光图像融合Transformer的水下目标分类方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120107655B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510098186.7,技术领域涉及:G06V10/764;该发明授权基于声光图像融合Transformer的水下目标分类方法及相关装置是由董山玲;周赛;刘妹琴;兰剑设计研发完成,并于2025-01-22向国家知识产权局提交的专利申请。
本基于声光图像融合Transformer的水下目标分类方法及相关装置在说明书摘要公布了:本发明属于计算机视觉中的图像分类技术领域,公开了一种基于声光图像融合Transformer的水下目标分类方法及相关装置;其中,所述水下目标图像分类方法包括以下步骤:获取待分类的光学及其对应的声学图像;基于所述待分类的声学及光学图像,采用预先训练好的深度图像分类网络进行水下目标分类,获得分类结果。本发明提出声光融合模块进行声光图像融合以及特征提取模块进行特征提取以及特征混合,增强特征的多样性和语义丰富性,进而提高水下目标图像分类准确率,解决了现有技术中存在的单一模态图像特征提取不充分与特征丰富性捕获不足所导致的水下目标图像较高误分类的技术问题。
本发明授权基于声光图像融合Transformer的水下目标分类方法及相关装置在权利要求书中公布了:1.一种基于声光图像融合Transformer的水下目标分类方法,其特征在于,包括以下步骤: 获取待分类的水下目标声学图像和光学图像; 基于所述待分类的水下目标声学图像和光学图像,采用预先训练好的深度图像分类网络进行水下目标分类,获得分类结果; 其中, 所述深度图像分类网络包括依次连接的声光融合模块、特征提取模块和线性分类头; 所述声光融合模块首先对声学图像和光学图像进行图像预处理,分别转化为声学图像张量以及光学图像张量;接着对成对的声学图像张量和光学图像张量进行通道拼接和混洗获得声光融合图像张量;所述特征提取模块采用多阶段编码器结构,每一阶段的编码器包括串联的补丁嵌入和若干基于池化校准注意力机制的编码器模块; 所述编码器模块包括依次串联连接的卷积位置编码模块、第一层归一化操作、池化校准注意力模块、第二层归一化操作和前馈神经网络层,并通过跳跃连接层分别将所述第一层归一化操作的输入与所述池化校准注意力模块的输出相加、将所述第二层归一化操作的输入与所述前馈神经网络的输出相加; 所述池化校准注意力模块包括基于风格池化的特征校准模块、多头转置自注意力模块和卷积相对位置编码模块;其中,所述基于风格池化的特征校准模块用于输入所述第一层归一化操作输出特征图经过线性映射形成的查询、键、值矩阵,输出经过特征校准的查询、键、值矩阵;所述多头转置自注意力模块用于输入经过特征校准的查询、键、值矩阵,输出多头转置自注意力模块输出特征图;所述卷积相对位置编码模块用于输入所述基于风格池化的特征校准模块输出的经过特征校准的查询、值矩阵,输出卷积相对位置编码模块输出矩阵;所述多头转置自注意力模块输出特征图与所述卷积相对位置编码模块输出矩阵之和形成池化校准注意力模块输出特征图; 所述的池化校准注意力模块的计算表示为: ; 其中, ; ; ; 式中,为Sigmoid激活函数;为卷积核尺寸为一维卷积的操作;分别为针对、、矩阵通道维度的风格池化操作,包括全局平均池化Ave和全局最大池化Max;为哈达玛积;为分通道进行滤波器尺寸为、的深度卷积操作;为缩放因子;为指数归一化函数;为矩阵转置;为池化校准注意力模块的输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励