杭州电子科技大学杨金晶获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种基于目标检测神经网络的声纳图像实时检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114219998B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111664998.1,技术领域涉及:G06V20/05;该发明授权一种基于目标检测神经网络的声纳图像实时检测方法是由杨金晶;秦飞巍;於勤翔设计研发完成,并于2021-12-31向国家知识产权局提交的专利申请。
本一种基于目标检测神经网络的声纳图像实时检测方法在说明书摘要公布了:本发明公开了一种基于目标检测神经网络的声纳图像实时检测方法。本发明步骤:步骤1、构建声呐图像数据集,并划分为训练集和测试集;步骤2、数据预处理:对构建的训练集和测试集进行降噪、数据归一化、全分辨率数据增广处理;步骤3、构建水下声呐图像实时检测网络;步骤4、基于训练集对声呐图像实时检测网络进行训练;步骤5、基于测试集验证声呐图像实时检测网络的准确性和实时性。本发明借鉴了YOLO系列、SSD与RetinaNet等网络的框架,设计并使用骨干网络,并最大限度增加输入信息量,通过数据扩充增加样本量,降噪预处理和设计损失函数等方法进行改进,以满足检测网络准确性的要求。最终设计了在保持速度优势的前提下并且提升了预测精度的SonarDet系统。
本发明授权一种基于目标检测神经网络的声纳图像实时检测方法在权利要求书中公布了:1.一种基于目标检测神经网络的声纳图像实时检测方法,其特征在于包括如下步骤: 步骤1、构建声呐图像数据集,并划分为训练集和测试集; 步骤2、数据预处理:对构建的训练集和测试集进行降噪、数据归一化、全分辨率数据增广处理; 步骤3、构建水下声呐图像实时检测网络,包括骨干网络、多尺度融合模块、kmeans算法模块、目标检测模块以及Loss函数设计模块;骨干网络选取改进的darknet-53网络,预处理后训练集中的图像经过骨干网络处理后得到两张尺度不同的高通道维度低分辨率的特征图;多尺度融合模块对得到的两个尺度的特征图进行融合,得到融合特征图;使用kmeans聚类模块对训练集数据中的标注框进行聚类,得到6个母先验框;通过母先验框的比例和位置随机生成多个先验框;目标检测模块基于kmeans聚类模块得到的先验框,对两个尺度的融合特征图进行预测,通过预测框坐标相对于先验框的四个偏移量,识别出融合特征图中声呐目标位置; 步骤4、基于训练集对声呐图像实时检测网络进行训练; 步骤5、基于测试集验证声呐图像实时检测网络的准确性和实时性; 步骤1具体实现如下: 声呐图像数据集来自中船重工715所提供的数据集,将数据集按照8:2分成训练集和测试集,并对训练集数据进行标注,其中训练集包含4002张,测试集包含1000张图片,目标检测物类别包含柱状、线状两种外形; 步骤3中的骨干网络具体结构如下: 骨干网络使用darknet-53的前52层,即去除全连接层并保留残差通路以及LeakyReLU激活函数; 经过预处理后的图像大小为1024*1024*1,将其输入骨干网络:首先是进入一个32个过滤器的卷积核,输出的图像大小为1024*1024*32,再将其一次输入到5组重复的残差单元residualblock中,这5组残差单元的每个残差单元都由一个单独的卷积层与一组重复执行的卷积层构成,重复执行的卷积层分别重复1次、2次、8次、8次、4次;在每个重复执行的卷积层中,先执行1×1的卷积操作,再执行3×3的卷积操作,过滤器数量先减半再恢复,一共是52层;最后选取骨干网络最后两层的特征图分别进行输出,得到两张尺度不同的高通道维度低分辨率的特征图; 步骤3中的kmeans算法模块具体实现如下: 先将融合后的特征图划为九宫格,每个小格2个尺度,每个尺度3个母先验框,基于这54个母先验框的比例和位置随机生成总共两千个先验框;每小格的6个母先验框是相同的,由kmeans算法模块统计训练集中的声呐图像的标注框的大小及长宽比,聚为6个类别; 步骤3中Loss函数设计模块具体实现如下: 在类别与交叉熵部分引用FocalLoss函数来解决one-stage目标检测中正负样本比例严重失衡的问题,并在FocalLoss函数的基础上设计增加了加速因子α,因此最终的Loss函数的具体公式如下: 其中,λcoord为用于平衡坐标损失影响力的超参,λcls为用于平衡分类损失影响力的超参,K表示网络输出层网格数目,M表示先验框的数目,表示第i个网格中第j个先验框与检测目标的负责度,β为用于放大对小框的坐标损失的超参,xi和yi分别表示第i个标注框的中心点的横坐标和纵坐标,和分别表示第i个预测框的中心点的横坐标和纵坐标,ωi和hi分别表示第i个标注框的宽和高,和分别表示第i个预测框的宽和高,FocalLoss表示FocalLoss函数,用于计算其分类损失程度; 加速因子α的设计如下: 首先定义数据集图像中任意区域的白点值为该区域像素数组中平均每元素数值大小;针对声呐图像中绝大多数目标区域的白点值比背景更高的特点,加速因子α能够绕过网络计算出额外的loss来影响梯度的计算,进而加速网络的收敛;加速因子α的具体公式如下: 在加速因子α的公式中,a为超参,用于增大惩罚力度,即平衡数值分布,x表示平均像素数值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。