西安工程大学纪超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安工程大学申请的专利基于改进yolox算法的复杂环境下输电线路鸟巢检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115861853B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211462156.2,技术领域涉及:G06V20/17;该发明授权基于改进yolox算法的复杂环境下输电线路鸟巢检测方法是由纪超;陈国燕;黄新波;王东旭;王博雅;王亮;侯威;宋智伟设计研发完成,并于2022-11-22向国家知识产权局提交的专利申请。
本基于改进yolox算法的复杂环境下输电线路鸟巢检测方法在说明书摘要公布了:本发明公开了一种基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,具体按照以下步骤实施:步骤1、采集鸟巢图像数据,标注并划分数据集为训练集、验证集和测试集;步骤2、建立改进yolox算法网络模型,采用深度通道注意力模块和损失函数对yolox目标检测算法进行改进;步骤3、将训练集中图像输入改进yolox算法网络模型进行训练,通过训练得到优化的yolox算法网络模型;步骤4、将测试集中图像输入优化的yolox模型进行检测,获得鸟巢检测结果图。本发明解决了现有技术中存在的复杂环境下鸟巢检测精度低的问题。
本发明授权基于改进yolox算法的复杂环境下输电线路鸟巢检测方法在权利要求书中公布了:1.基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,其特征在于,具体按照以下步骤实施: 步骤1、采集鸟巢图像数据,标注并划分数据集为训练集、验证集和测试集; 步骤2、建立改进yolox算法网络模型,采用深度通道注意力模块和损失函数对yolox目标检测算法进行改进; 所述步骤2具体按照以下步骤实施: 步骤2.1、改进yolox算法网络模型保持原yolox网络的Focus层、SPP层、CBS层、Neck层和prediction层的组合网络不变;主干网络Backbone中CSP1_X层添加深度通道注意力模块; 步骤2.2、深度通道注意力模块结构如下: 对于输入的特征图XX1in、X2in、X3in,X∈RCxWxH,C为通道数,W和H为特征图的高和宽; 首先,利用最大池化和平均池化从两个角度提取第一分支输入特征图X1in的特征: Xmax1=fmaxpoolX1in1 Xavg1=favgpoolX1in2 其中,X1in表示第一分支输入特征图,fmaxpool表示进行最大池化,favgpool表示进行平均池化,Xmax1表示最大池化的结果并且Xmax1∈RC×H2×W2,Xavg1表示平均的结果并且Xavg1∈RC ×H2×W2;采用最大池提取输入特征图的重要信息,采用平均池提取输入特征图全局信息,将最大池化与平均池化的结果进行堆叠,通过Sigmoid函数输出: Ac=σ[ZconcatXmax1+Xavgl]3 其中,σ表示Sigmoid函数,Zconcat表示将最大池化与平均池化的结果进行堆叠,Ac表示经过Sigmoid函数的输出结果并且Ac∈RC×1×1,Ac中的每个元素都表示其对应通道的重要性级别; 其次,将输入特征图X1in分为两个路径,一个路径与Sigmoid函数输出进行融合;另一个路径先进行3x3的卷积后,通过深度可分离卷积之后经过Relu函数输出: Xl-1=Ac*Xlin Xl-2=fconv3Xlin Xl-3=Relu[fconv3×3Xl-2+fconv1×1Xl-2]4 其中X1-1表示输入特征图X1in与Sigmoid函数输出Ac融合的结果,fconv3表示进行3x3的卷积运算,X1-2表示3x3的卷积运算的结果,fconv3x3表示逐通道卷积,fconv1x1表示逐点卷积,逐通道卷积fconv3x3和逐点卷积fconv1x1合称为深度可分离卷积,Relu表示进行Relu激活运算,X1-3表示进行Relu激活运算的结果; 最后,将X1-1与X1-3进行堆叠输出: X1-out=Xl-1+Xl-35 其中,X1-out表示X1-1和X1-3进行堆叠的结果,以上提取特征过程即为深度提取, 深度通道注意力模块的第二分支输入特征图X2in的宽和高进行2倍上采样和第三分支输入特征图X3in的宽和高进行4倍上采样之后都输入到深度提取中提取特征;第二分支输入特征图X2in在深度提取特征后经过最大池化输出得到X2-out和第三分支输入特征图X3in在深度提取特征后经过平均池化输出得到X3-out: X2-out=fmaxpool[FDMUP2X2in]6 X3-out=favgpool[FDMUP4X3in]7 其中X2in表示第二分支输入特征图,X3in表示第三分支输入特征图,UP2表示对第二分支输入特征图X2in的宽和高进行2倍上采样,UP4表示对第三分支输入特征图X3in的宽和高进行4倍上采样,FDM表示把上采样后的特征图输入到深度提取中提取特征,X2-out表示经过最大池化后的第二分支输出结果,X3-out表示经过平均池化后的第三分支输出结果; 深度通道注意力模块的最后部分是将输入特征图X的三个分支输出结果X1-out、X2-out、X3-out进行堆叠,再与输入特征图X进行加权融合得到目标的权重,输出新特征图: X'=X×X1-out+X2-out+X3-out8 其中X’表示三个分支输出结果X1-out、X2-out、X3-out进行加权融合后的新特征图; 步骤2.3、在Resunit层的两个CBS结构之间加入深度通道注意力模块,将改进后的Resunit层命名为Resunit*层,同时将Resunit*层引进CSP1_X层中进行提取目标,将改进后的CSP1_X层命名为CSP1_X*层,将CSP1_X*层引入yolox算法中得到改进yolox算法网络模型, 步骤2.4、在预测层选择现阶段表现最好的EIoU损失函数替换原IoU损失函数,EIOU损失函数计算公式如下: 其中,IoU表示真实框A与预测框B的交集与并集之比,b和bgt分别为预测框和真实框的中心点,c为能够同时包含预测框和真实框的最小闭合区域的对角线距离;p为两个中心点之间的欧式距离,α为权重因子,v为纵横比的相似度,wgt表示真实框的宽度,hgt表示真实框的高度,w表示预测帧的宽度,h表示预测帧的高度,LossCIoU表示CIoU函数的损失,LossEIoU表示EIoU函数的损失;LossEIoU损失函数包含三个部分:重叠损失1-IoU,中心距离损失宽高损失前两部分延续CIOU中的方法,但是LossEIoU损失函数的宽高损失直接使目标框与预测框的宽度和高度之差最小,使得收敛速度更快; 在EIOU的基础上结合损失函数FocalLoss提出一种FocalEIOULoss,从梯度的角度出发,把高质量的锚框和低质量的锚框分开,公式如下: LFocal-EIoU=IoUγLossEIoU15 其中,γ为控制异常值抑制程度的参数,IoU表示真实框A与预测框B的交集与并集之比,LFocal-EIoU表示提出的FocalEIOULoss,得到改进yolox算法网络模型; 步骤3、将训练集中图像输入改进yolox算法网络模型进行训练,通过训练得到优化的yolox算法网络模型; 步骤4、将测试集中图像输入优化的yolox模型进行检测,获得鸟巢检测结果图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安工程大学,其通讯地址为:710048 陕西省西安市碑林区金花南路19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。