重庆邮电大学唐贤伦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利基于区域聚类和特征注意力机制的航拍小目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119741621B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411724591.7,技术领域涉及:G06V20/17;该发明授权基于区域聚类和特征注意力机制的航拍小目标检测方法是由唐贤伦;江欣彦;谢颖;唐瑜泽;邓武权;陈秋;汪应;王乐君;李伟生设计研发完成,并于2024-11-28向国家知识产权局提交的专利申请。
本基于区域聚类和特征注意力机制的航拍小目标检测方法在说明书摘要公布了:本发明请求保护一种基于区域聚类和特征注意力机制的航拍小目标检测方法。首先将从输入图像中提取到的候选目标的中心坐标作为聚类算法的输入特征。然后使用基于密度的DBSCAN聚类算法对这些目标进行聚类,随后根据聚类结果从图像中裁剪出这些区域,对裁剪出的区域进行中心填充处理来使其保持合理范围内的尺度和比率并将其与原始数据集合并得到新的扩充后的数据集。将扩充后的数据集放入改进后的单阶段目标检测网络RetinaNet中进行训练,用基于注意力机制的检测头进行最终的目标分类和定位。该方法可以达到数据增强的效果。此外,基于注意力机制的检测头可以去除分类和回归任务中无用信息的干扰,使网络能够自适应地关注更适当的信息进行分类和回归。
本发明授权基于区域聚类和特征注意力机制的航拍小目标检测方法在权利要求书中公布了:1.一种基于区域聚类和特征注意力机制的航拍小目标检测方法,其特征在于,包括以下步骤: 步骤1:从公开的航拍图像目标检测数据集VisDrone中获取输入图像,并将其输入到以残差网络为主干特征提取网络、特征金字塔网络FPN为颈部融合网络的视网膜检测网络RetinaNet中进行特征提取得到粗略的候选目标信息; 步骤2:利用基于密度的聚类算法DBSCAN对步骤1中提取的粗略的候选目标信息进行计算,将密集的目标进行聚类,裁剪出目标聚集区域并对其进行中心填充处理进行尺度缩放,裁剪的图像作为新的输入从而扩充原始数据集,得到扩充后的数据集命名为VisDrone-E; 步骤3:在RetinaNet算法的基础上,使用以下改进来构建新的特征增强视网膜检测网络FS-RetinaNet检测模型;1在特征金字塔网络的最高层构建级联的膨胀卷积层提取充分的上下文信息;2使用基于注意力机制的检测头替换原始的检测头使得分类任务和回归任务更具有针对性; 步骤4:使用步骤2中的VisDrone-E训练步骤3中改进后的FS-RetinaNet用于检测小目标; 步骤5:将步骤4中训练好的模型权重传入测试网络中,以VisDrone作为测试输入,对目标的边界框和类别信息进行预测; 步骤6:使用非极大抑制NMS进行后处理去除冗余的检测框,用于减少误检或重复检测; 所述步骤3在特征金字塔网络的最高层构建级联的膨胀卷积层提取充分的上下文信息,具体为: 首先,提出了一个由级联的膨胀卷积层构成的上下文信息增强模块CIEM,将其添加在FPN的最高特征层次的横向连接处以缓解小目标信息丢失问题;膨胀卷积层的输出定义为Di=DilatedConvd_rateConv1×1_512Xi,其中,Xi表示前一层膨胀卷积层的输出与之前所有层的输出在通道维度上拼接后的结果,即Xori表示特征金字塔最高层的原始输入特征图,Conv1×1_512表示对Xi进行1×1的卷积将其通道数改变为512,DilatedConvd_rate表示按照d_rate的膨胀率对输入特征图进行膨胀卷积并将其通道数调整为256;此外,为了让输出特征具有更好的尺度多样性,将Xori进行缩放得到XD,然后通过双线性插值法将XD上采样到原始输入大小得到特征图XU,并且利用1×1的卷积将其通道数压缩到256;最后将XU与Dii=1,2,…5进行拼接,再通过1×1的卷积融合各层次间的信息得到输出XE,XE=Conv1×1D1||D2||D3||D4||D5||XU;为了保持初始输入的有效信息,将经过CIEM后输出的特征图XE与经过了1×1卷积后的原始特征图相加作为最终的输出结果至此,便得到了融合了粗粒度和细粒度特征且具有丰富上下文语义信息的最高层特征图; 所述步骤3使用基于注意力机制的检测头替换原始的检测头使得分类任务和回归任务更具有针对性,具体包括: 用基于注意力机制的检测头替换原始的检测头;在分类子网络和回归子网络之前分别添加一个注意力模块,使其自适应地按照不同的任务需求选择更匹配任务目标的特征;注意力模块的具体实现如下:Ai=σφXin,Fi=Ai⊙Xin+Xin,其中,Xin表示输入的待测特征图,φXin表示在Xin上执行四层3×3的卷积操作,σ是sigmoid函数,它将φXin的值转换为[0,1]之间的值,以便它在训练期间更快地收敛;然后将注意力模块的输出值Ai和Xin相应元素相乘的结果添加到Xin中;乘法运算可以使Xin中的有用信息值增大,无用信息值减小,加法运算是利用残差网络的思想,使网络更快地收敛,这种设计可以使网络自适应地选择适合分类或回归的特征;最终得到增强后的输出特征图Fi。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励