江西师范大学王晓庆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西师范大学申请的专利基于改进YOLOv8的电梯内电动车识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119181012B 。
龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411687121.8,技术领域涉及:G06V10/82;该发明授权基于改进YOLOv8的电梯内电动车识别方法是由王晓庆;陈云龙;颜昌宇;王岚清;罗文兵;王涛;刘振桢;杜嘉诚设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。
本基于改进YOLOv8的电梯内电动车识别方法在说明书摘要公布了:本发明公开了基于改进YOLOv8的电梯内电动车识别方法,包括如下步骤:采集电动车入梯图像;构建电动车识别模型,电动车识别模型由特征提取骨干网络模块、聚合颈部网络模块、多维协作注意力模块和候选框预测模块组成;采用特征提取骨干网络模块提取采集的图像的不同分辨率的特征图;并通过聚合颈部网络模块进行融合,将融合后的特征图输入多维协作注意力模块,生成多维加权特征图;将多维加权特征图输入候选框预测模块中生成最终预测输出;本发明通过设计局部聚合模块并将其引入聚合颈部网络模块中,通过分层级特征聚合可使得电动车识别模型在复杂场景中表现更佳,对电梯内小型电动车和电动车边缘细节的识别能力显著提升。
本发明授权基于改进YOLOv8的电梯内电动车识别方法在权利要求书中公布了:1.基于改进YOLOv8的电梯内电动车识别方法,其特征在于,包括如下步骤:步骤S1:构建电动车入梯图像数据集,电动车入梯图像数据集内包括若干电动车入梯图像;步骤S2:构建电动车识别模型,所述电动车识别模型由特征提取骨干网络模块、聚合颈部网络模块、多维协作注意力模块和候选框预测模块组成,且特征提取骨干网络模块、聚合颈部网络模块、多维协作注意力模块和候选框预测模块呈串行排列;步骤S3:将电动车入梯图像数据集中的电动车入梯图像输入到特征提取骨干网络模块进行特征提取,分别得到高分辨率电动车入梯特征图、中分辨率电动车入梯特征图和低分辨率电动车入梯特征图;步骤S4:将高分辨率电动车入梯特征图、中分辨率电动车入梯特征图和低分辨率电动车入梯特征图通过并行通道输入聚合颈部网络模块中进行融合,分别得到高分辨率电动车入梯聚合特征图、中分辨率电动车入梯聚合特征图和低分辨率电动车入梯聚合特征图;步骤S5:将高分辨率电动车入梯聚合特征图、中分辨率电动车入梯聚合特征图和低分辨率电动车入梯聚合特征图输入多维协作注意力模块,按不同分辨率分别从高分辨率电动车入梯聚合特征图、中分辨率电动车入梯聚合特征图和低分辨率电动车入梯聚合特征图的通道、空间和位置三个维度上提取维度特征图,通过平均池化和标准差池化来汇聚维度特征图,通过激励变换计算汇聚后维度特征图的权重,生成多维加权特征图;步骤S6:将多维加权特征图输入候选框预测模块,通过边界框回归、目标分类和置信度预测对多维加权特征图进行目标预测,将预测结果进行后处理,生成最终预测输出;聚合颈部网络模块由第一局部聚合模块、第二局部聚合模块、第三局部聚合模块、第四局部聚合模块、第一群组交换卷积块、第二群组交换卷积块和第三群组交换卷积块组成;聚合颈部网络模块的处理流程为:将低分辨率电动车入梯特征图进行上采样与中分辨率电动车入梯特征图进行拼接得到中低尺度融合特征图,将中低尺度融合特征图输入第一局部聚合模块,得到中低尺度聚合特征图,将中低尺度聚合特征图输入第一群组交换卷积块,得到中低尺度卷积特征图,将中低尺度卷积特征图与高分辨率电动车入梯特征图进行拼接,得到多尺度聚合特征图,将多尺度聚合特征图输入第二局部聚合模块,得到高分辨率电动车入梯聚合特征图,将高分辨率电动车入梯聚合特征图输入第二群组交换卷积块,得到多尺度卷积特征图,将多尺度卷积特征图与中低尺度聚合特征图进行拼接,得到多尺度拼接特征图,将多尺度拼接特征图输入第三局部聚合模块,得到中分辨率电动车入梯聚合特征图,将中分辨率电动车入梯聚合特征图输入第三群组交换卷积块,得到多层卷积特征图,将多层卷积特征图与低分辨率电动车入梯特征图进行拼接,得到多层拼接特征图,将多层拼接特征图输入第四局部聚合模块,得到低分辨率电动车入梯聚合特征图;其中,上采样操作采用双线性插值方法;特征提取骨干网络模块由依次连接的第一卷积层、第二卷积层、第一特征融合拼接层、第三卷积层、第二特征融合拼接层、第四卷积层、第三特征融合拼接层、第五卷积层、第四特征融合拼接层和池化层组成;其中,第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层结构相同;第一特征融合拼接层、第二特征融合拼接层和第三特征融合拼接层结构相同;特征提取骨干网络模块的处理流程为:输入图像即电动车入梯图像依次经过第一卷积层、第二卷积层、第一特征融合拼接层、第三卷积层、第二特征融合拼接层、第四卷积层、第三特征融合拼接层、第五卷积层、第四特征融合拼接层和池化层,其中,第二特征融合拼接层的输出即为高分辨率电动车入梯特征图Xb,第三特征融合拼接层的输出即为中分辨率电动车入梯特征图Xm,池化层的输出即为低分辨率电动车入梯特征图Xs;第一局部聚合模块、第二局部聚合模块、第三局部聚合模块和第四局部聚合模块结构均相同,由VoVNet模块和CSPNet模块结合而成;第一局部聚合模块的处理流程为:VoVNet模块:首先,对输入即中低尺度融合特征图进行多次卷积操作,得到多卷积特征图XX1conv,X2conv,其中,X1conv是经过第一次普通卷积操作后的特征图,X2conv是将X1conv进行第二次普通卷积操作后的特征图;随后,将X2conv经过深度可分离卷积操作得到深度卷积特征图X3conv;最后,将多卷积特征图X与深度卷积特征图X3conv进行拼接操作,得到VoVNet模块的输出X4conv;CSPNet模块:首先,利用分割操作将VoVNet模块的输出X4conv分为第一部分Xpart1和第二部分Xpart2,然后,对第二部分Xpart2进行卷积操作,得到跨阶段卷积特征图Xpart2_conv,再将第一部分Xpart1和跨阶段卷积特征图Xpart2_conv进行拼接操作,得到第一局部聚合模块的输出;第一卷积层的处理流程为:将输入图像即电动车入梯图像表示为,表示输入图像的通道数,和分别表示输入图像的高度和宽度,表示实数集;第一卷积层的处理过程表示为: ;式中,是经过第一卷积层后输出的特征图;是激活函数SiLU;代表的是卷积运算;和是第一卷积层的权重和偏置;表示卷积运算过程中每次滑动的步长;第一特征融合拼接层的处理流程为:将第二卷积层的输出输入第一特征融合拼接层后,分为直接传递部分和卷积处理部分,表示为: ;式中,表示直接传递部分;表示卷积处理部分;,和分别表示和的通道数;表示第一特征融合拼接层;对卷积处理部分进行处理,表示为: ;式中,、分别表示第一特征融合拼接层中第个卷积层的权重和偏置;将处理后的与进行拼接,得到拼接特征,最后将拼接特征再经过第一特征融合拼接层的最终卷积层,得到第一特征融合拼接层的输出,表示为: ; ;式中,表示拼接操作;和表示第一特征融合拼接层的最终卷积层的权重和偏置;池化层的处理流程为:将第四特征融合拼接层的输出输入池化层,先通过一个步长为1的卷积层,得到激活特征图,然后对激活特征图进行最大池化运算,得到池化特征图,表示为: ;式中,表示池化层中从不同大小的池化核k产生的特征图,即池化特征图;代表对激活特征图进行多尺度的最大池化操作;表示池化核的大小;表示对激活特征图的填充数量;为填充数量的具体值;将激活特征图与池化特征图在通道维度上进行拼接,并通过卷积操作整合多尺度信息,且同时压缩通道数,得到池化层的输出,即低分辨率特征图Xs;第一群组交换卷积块、第二群组交换卷积块、第三群组交换卷积块结构相同;第一群组交换卷积块的工作流程为:首先,对输入即第一局部聚合模块的输出先通过一个卷积层进行标准卷积操作,得到群卷积特征图Xcsp1,接着,将群卷积Xcsp1再通过一个1×1的卷积层进行一次卷积操作,生成额外的幽灵特征并得到幽灵特征图Xghost,然后,通过通道混洗操作打乱幽灵特征的通道顺序,得到群卷积幽灵特征图,即第一群组交换卷积块的输出,表示为: ;式中,Xghost_s是幽灵特征经过通道混洗操作后得到的群卷积幽灵特征图;表示通道混洗操作;步骤S5的具体过程为:将聚合颈部网络模块的输出即高分辨率电动车入梯聚合特征图、中分辨率电动车入梯聚合特征图和低分辨率电动车入梯聚合特征图输入多维协作注意力模块中,通过通道维度注意力特征建模、空间维度注意力特征建模和位置维度注意力特征建模分别计算注意力权重并进行协同融合;通道维度注意力特征建模的具体过程为:首先,对输入即聚合颈部网络模块的输出在空间维度上进行全局平均池化,得到通道权重向量fc∈Rc,表示为: ;式中,表示对通道c上所有像素值的平均;分别表示中行和列的索引,取值范围为和;通过双重求和遍历通道c上所有的空间位置即所有像素点,对像素值进行累加,得到Xpc,u,v,Xpc,u,v表示输入在通道c上、位置u,v处的像素值;对通道权重向量fc进行线性变换,得到每个通道的权重Wc,然后将Wc应用于的每个通道输出,得到通道维度注意力特征建模的输出,表示为: ;式中,是激活函数Sigmoid;Wc和bc分别表示每个通道的权重参数和偏置参数;空间维度注意力特征建模的具体过程为:对输入在通道维度上用平均池化和最大池化进行聚合,得到二维空间特征图,表示为: ;式中,表示在通道维度上对输入进行平均池化;表示在通道维度上对输入进行最大池化;表示输入在位置u,v处的所有通道上的像素值;表示所有通道;将二维空间特征图通过一个7×7卷积层学习空间权重后与输入相乘,得到空间维度注意力特征建模的输出,表示为: ;式中,表示采用7×7的卷积层对二维空间特征图进行卷积操作;位置维度注意力特征建模的具体过程为:将输入映射到三个不同的空间生成向量,表示为: ;式中,表示查询向量;是查询向量的权重矩阵;表示键向量;表示值向量;是键向量的权重矩阵;是值向量的权重矩阵;得到向量后,再通过softmax函数计算注意力权重,并使用注意力权重进行加权,得到位置维度注意力特征建模的输出,表示为: ;式中,表示输入中位置的查询向量;表示输入中位置的键向量;表示输入中位置处的值向量;表示Softmax函数;表示对输入中所有位置进行求和;分别表示输入中横坐标为,纵坐标为的位置;将、、融合,形成最终的多维加权特征图,表示为: ;式中,表示逐元素相乘;采用了MPDIoU损失函数来作为边界框回归的损失函数,表示为: ;式中,表示预测框与真实框的交并比;和是额外的权重系数,用于平衡新的距离度量和长宽比的影响;表示在极坐标下,考虑方向角的影响,预测框与真实框之间的最大距离;表示预测框和真实框的对角线长度最大值;是衡量预测框与真实框长宽比差异的项,是原CIoU损失函数中用于平衡长宽比的权重系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西师范大学,其通讯地址为:330000 江西省南昌市高新技术开发区紫阳大道99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。