Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 辽宁工程技术大学李建东获国家专利权

辽宁工程技术大学李建东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉辽宁工程技术大学申请的专利一种基于注意力机制的无人机红外小目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119942379B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510041578.X,技术领域涉及:G06V20/17;该发明授权一种基于注意力机制的无人机红外小目标检测方法是由李建东;潘远洋设计研发完成,并于2025-01-10向国家知识产权局提交的专利申请。

一种基于注意力机制的无人机红外小目标检测方法在说明书摘要公布了:本发明涉及红外小目标检测技术领域,具体为一种基于注意力机制的无人机红外小目标检测方法,包括以下步骤:检测模型确定、模型修订和红外小目标检测。本申请在YOLO11模型的基础上进行改进,即利用深度可分离卷积和DSEAM模块达到标准化数据分布,加速模型的训练,使得在运行过程中可以在增强红外小目标特征信息的同时显著减少不必要的向前传播信息;同时利用S_RepViTBlock模块可以在捕获红外小目标的同时,利用更大的感受野来增强对背景和目标特征的细节提取能力,以充分减少误差,提升红外小目标的检测质量。

本发明授权一种基于注意力机制的无人机红外小目标检测方法在权利要求书中公布了:1.一种基于注意力机制的无人机红外小目标检测方法,其特征在于,包括以下步骤: S1、检测模型确定:采用YOLO11模型,该模型由主干网络Backbone、颈部网络Neck、头部网络Head三部分组成; S2、模型修订:在YOLO11主干网络的第三层与第六层添加高效双通道特征增强模块DSEAM模块,其可以在增强红外小目标特征信息的同时显著减少不必要的向前传播信息;原头部结构Head第19与22层的标准卷积换为S_RepViTBlock模块;模型中整体使用NWD损失函数; 所述S2中的高效双通道特征增强模块DSEAM模块的设计思路包括以下步骤: 第一、在ECA的输入前加入深度可分离卷积,先进行深度卷积,将输出进行批归一化,此操作可以标准化数据分布,加速模型的训练;批归一化计算公式如下: 其中:μ为当前批次均值,σ2为当前批次方差,γ和β为可学习的缩放和平移参数,∈为防除零参数; 第二、输出后对结果进行ReLU激活来增加模型非线性能力表达,ReLU激活函数公式如下: x=ReLUx=max0,x ReLU将所有负值映射为0,正值保持不变,可以减少梯度消失现象;之后进行逐点卷积来调整通道数,实现通道信息的线性组合,并对输出结果再进行一次批归一化和ReLU激活,将将当前的特征张量x保存为x_orig,用于后续的残差连接; 第三、将信息处理的结果输入到ECA模块里进行全局平均池化,得到每个通道的全局特征;公式为: y=AvgPoolx 输出张量y形状为B,c2,1,1,随后对y进行维度变换到适合一维卷积输入格式,对y进行一维卷积来捕获通道间的局部依赖关系,再对y进行维度还原,以便与输入特性x相乘,对y进行一次温度调节的Sigmoid激活生成通道注意力权重;带温度调节的Sigmoid激活函数公式如下所示: 其中T为温度参数,默认设置为0.5,最后输出注意力通道权重CA的形状为B,c2,1,1;将CA与特征x进行逐元素相乘扩展为形状B,c2,H,W;对输入的特征xB,C,H,W分别进行平均池化AvgOut得到B,1,H,W和最大池化MaxOut得到B,1,H,W;公式为: AvgOut=Meanx,dim=1,keepdim=True MaxOut=Maxx,dim=1,keepdim=True 输出的平均池化结果AvgOut形状为B,1,H,W,最大池化结果MaxOut形状为B,1,H,W;前者可以提取全局信息,后者可以在通道内提取出显著特征; 第四、将两张池化后的特征图进行可学习权重参数α和β进行融合;融合公式如下: Fusion=α×AvgOut+β×MaxOut 其中的α和β初始值都为0.5,对融合后的特征Fusion进行卷积来提取空间注意力特征,卷积核大小设置为5,可以很好兼顾到各尺度特征的提取;对卷积后结果进行Sigmoid激活,将权重压缩在0到1之间,可以网络能够抑制不重要的区域并突出重要的区域,生成带有空间注意力的权重;公式为: 输出的SA形状B,1,H,W,再对其进行扩展,使其形状变为B,c2,H,W;采用可学习的参数α、β与两次扩展的张量进行加权融合,为了确保权重的归一化,使用Softmax函数对[α,β]进行归一化;公式: [ωα,ωβ]=Softmax[α,β] CombineOut=ωα×xca+ωβ×xsa 其中xca和xsa分别是前面特征x与通道权重扩展和空间权重扩展后的输出张量,融合后特征CombinedOut的形状为B,c2,H,W; 第五、将融合特征与先前保存的特征x_orig相加,实现残差连接,可以增强信息流动,防止梯度消失;最后输出的特征OutPut形状为B,c2,H,W;在实际应用中,DSEAM模块可以在复杂环境下对细小且密集检测目标的特征增强,并降低了模型的计算量和参数量; 所述S2中S_RepViTBlock模块的设计步骤包括: 第一、RepViT通过将高效的Vit架构融入CNN中,在移动设备上实现了较好的准确率和延迟平衡;但基于无人机红外检测图像情况,图像可能随着距离远、镜头污染以及任务场景复杂等因素导致成像出现噪点或者像素质量下降,很难将目标与背景混合一起时分离开来;将RepViT模块进行改进加入到YOLO11中; 第二在输入部分引入膨胀卷积来增大感受野,可以在捕获红外小目标的同时,利用更大的感受野来增强对背景和目标特征的细节提取能力;为了增强模型的泛化能力,提升模型应对噪声和模糊特征的能力,引入DropBlock正则化,DropbBock在特征图上随机遮挡连续的矩形区域,使得模型在更广泛的上下文中学习特征;公式为: 其中B为批量大小batchsize,C为通道数,H和W分别是高度和宽度,p为置零概率,遮挡尺寸为k×k; 第三、命RepViT改进后为S_RepViT模块; S3、红外小目标检测:将输入图像划分为S×S网格,每个网格预测固定数量的边界框及其置信度和类别概率;置信度表示边界框包含物体的概率,由目标存在概率和预测框与真实框的重叠程度组成;输出向量包含边界框坐标、置信度和类别概率;改进后的YOLO11模型使用综合损失函数衡量预测误差;最后,非极大值抑制NMS去除重叠边界框,保留置信度最高的框;进行红外小目标的检测; 所述S3中的误差包括位置误差MSE计算、置信度误差和类别误差Cross-Entropy度量。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人辽宁工程技术大学,其通讯地址为:123000 辽宁省阜新市细河区中华路47号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。