安徽凌坤智能科技有限公司年四成获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽凌坤智能科技有限公司申请的专利一种基于中位值注意力残差网络的猪脸识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115188029B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210953320.3,技术领域涉及:G06V40/10;该发明授权一种基于中位值注意力残差网络的猪脸识别方法是由年四成;陶松兵;何启航;刘金珠;张庆文;胡杰杰;吴学栋设计研发完成,并于2022-08-09向国家知识产权局提交的专利申请。
本一种基于中位值注意力残差网络的猪脸识别方法在说明书摘要公布了:本发明公开了一种基于中位值注意力残差网络的猪脸识别方法,属于模式识别技术领域,该发明方法通过训练集对中位值注意力残差网络进行反复的迭代训练,得到具有最佳识别性能的猪脸识别模型,并使用其对待识别的猪脸图像实现猪脸识别。本发明方法引入注意力机制到残差网络中,其中,注意力机制的数据压缩方法采取中位值压缩,得到更好的通道描述符,并赋予不同通道更精准的权值。本发明的方法在测试集上有着很好的识别正确率,均高于传统的分类方法。因此,能很好解决目前猪脸识别中存在的问题,适应实际的应用。
本发明授权一种基于中位值注意力残差网络的猪脸识别方法在权利要求书中公布了:1.一种基于中位值注意力残差网络的猪脸识别方法,其特征在于,包括通过训练中位值注意力残差网络得到具有最优识别性能的猪脸识别模型,并利用该猪脸识别模型实现猪脸图像的识别,具体包括以下步骤: 步骤1,构建猪脸识别的训练集和测试集 采集M类猪脸图片,其中M记为猪脸的类别数; 对M类猪脸图片的每个类别随机挑选A张猪脸图片,获得M×A张猪脸图片,然后对M×A张猪脸图片采用B种图像预处理方式进行图像增强,并保留每种图像处理方式得到的猪脸图像,即共得到A×M×B+1张猪脸图片,该A×M×B+1张猪脸图片组成训练集; 在M类猪脸图片的每类中另外挑选C张猪脸图片,获得M×C张猪脸图片,该M×C张猪脸图片组成测试集,A≠C; 步骤2,训练中位值注意力残差网络得到最优分类效果模型,并将最优分类效果模型记为猪脸识别模型,具体步骤如下: 步骤2.1,选取残差网络ResNet50作为主干网络,在主干网络中加入基于中位值压缩的注意力机制,赋予不同通道权值对通道值进行校正,得到中位值注意力残差网络,并记为MAM_ResNet50; 所述MAM_ResNet50的结构包括:一个卷积矩阵大小为7×7、卷积步距为2、通道数为64的卷积层Ω1,一个卷积矩阵大小为3×3、卷积步距为2的最大池化层Λ1,一个由3个相同的中位值注意力残差结构1沿MAM_ResNet50输入-输出方向串联得到的一级中位值注意力残差单元Φ1,一个由4个相同的中位值注意力残差结构2沿MAM_ResNet50输入-输出方向串联得到的二级中位值注意力残差单元Φ2,一个由6个相同的中位值注意力残差结构3沿MAM_ResNet50输入-输出方向串联得到的三级中位值注意力残差单元Φ3,一个由3个相同的中位值注意力残差结构4沿MAM_ResNet50输入-输出方向串联得到的四级中位值注意力残差单元Φ4,一个全局平均池化层Λ2; MAM_ResNet50的输入依次为卷积层Ω1、最大池化层Λ1、一级中位值注意力残差单元Φ1、二级中位值注意力残差单元Φ2、三级中位值注意力残差单元Φ3、四级中位值注意力残差单元Φ4和全局平均池化层Λ2; 所述中位值注意力残差结构1沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为64的卷积层,卷积矩阵大小为3×3通道数为64的卷积层,卷积矩阵大小为1×1通道数为256的卷积层,在卷积矩阵大小为1×1通道数为256的卷积层后插入基于中位值压缩的注意力机制; 中位值注意力残差结构2沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为128的卷积层,卷积矩阵大小为3×3通道数为128的卷积层,卷积矩阵大小为1×1通道数为512的卷积层,在卷积矩阵大小为1×1通道数为512的卷积层后插入基于中位值压缩的注意力机制; 中位值注意力残差结构3沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为256的卷积层,卷积矩阵大小为3×3通道数为256的卷积层,卷积矩阵大小为1×1通道数为1024的卷积层,在卷积矩阵大小为1×1通道数为1024的卷积层后插入基于中位值压缩的注意力机制; 中位值注意力残差结构4沿MAM_ResNet50输入-输出方向依次由以下三个卷积层串联得到:卷积矩阵大小为1×1通道数为512的卷积层,卷积矩阵大小为3×3通道数为512的卷积层,卷积矩阵大小为1×1通道数为2048的卷积层,在卷积矩阵大小为1×1通道数为2048的卷积层后插入基于中位值压缩的注意力机制; 将基于中位值压缩的注意力机制插入前的卷积层的通道数记为δ,δ或等于256或等于512或等于1024或等于2048; 步骤2.2,利用训练集对步骤2.1所述的MAM_ResNet50进行优化,具体步骤如下: 步骤2.2.1,采用图像归一化处理方式,将训练集中的所有猪脸图像的像素统一调整为I×I; 步骤2.2.2,随机选取训练集中的J张猪脸图像,并将其中任意一个猪脸图像的序号记为x,x=1,2,...,J,将第x张猪脸图像的真实one-hot编码序列记为Hx,其中,q为真实one-hot编码序列Hx中每个真实one-hot编码值的序号,q=1,2,...,M,表示序号为x的猪脸图像在真实one-hot编码序列Hx中的第q个真实one-hot编码值; 真实one-hot编码序列Hx的取值定义为:令且此时 中的其他真实one-hot编码值均等于0; 步骤2.2.3,将步骤2.2.2选取得到的J张猪脸图像输入MAM_ResNet50,输出每张猪脸图像的预测one-hot编码序列Xx,其中p为预测one-hot编码序列Xx中每个预测one-hot编码值的序号,p=1,2,...,M,表示序号为x的猪脸图像在预测one-hot编码序列Xx中的第p个预测one-hot编码值; 步骤2.2.4,根据真实one-hot编码序列Hx与预测one-hot编码序列Xx,通过反向传播操作,对MAM_ResNet50的网络权重进行更新优化,具体方式如下: 计算真实one-hot编码序列Hx与预测one-hot编码序列Xx之间的损失函数loss,其中,||·||2表示欧几里得范数; 通过梯度下降法最小化损失函数loss,反向传播更新神经网络元之间连接的权重,完成此次MAM_ResNet50的训练; 步骤2.2.5,重复步骤2.2.2至步骤2.2.4,直至训练集中所有猪脸图像都被选取过;其中,如果最后一轮选取中,训练集剩下的猪脸图像数小于J,则从已经选取过的猪脸图像中随机选取猪脸图像进行补充; 将通过步骤2.2.2到步骤2.2.5完成训练的MAM_ResNet50称为第L轮的MAM_ResNet50,并记为网络TL,其中L为轮数的序号,L=i,2,…G,G为重复次数; 步骤2.3,通过测试集,计算网络TL对测试集分类的正确率PL, 为网络TL对测试集中猪脸图像分类正确的数值, 步骤2.4,G次重复步骤2.2至步骤2.3,得到一个网络集合T和一个正确率集合P,T={T1,T2,...,TL,...,TG},P={P1,P2,...,PL,...,PG}; 步骤2.5,在正确率集合P中取最大的正确率值记为最大正确率Pmax,在网络集合T中取最大正确率Pmzx对应的MAM_ResNet50网络作为具有最优识别性能的MAM_ResNet50网络,并记为猪脸识别模型; 步骤3,通过猪脸识别模型实现猪脸识别,具体步骤如下: 步骤3.1,将待识别猪脸图像输入至猪脸识别模型,猪脸识别模型对待识别猪脸图像进行特征提取并生成待识别猪脸图像特征序列K,其中K=k1,k2,...,kw,...,kZ,w表示待识别猪脸图像特征序列的维数,kw表示第w维待识别猪脸图像特征序列的值,w=1,2,...,Z; 步骤3.2,取kτ=max{k1,k2,...,kw,...,kZ},τ对应的待识别猪脸图像特征序列K的维数即为待识别猪脸的类别数,kτ的数值为该类别数的置信度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽凌坤智能科技有限公司,其通讯地址为:233000 安徽省蚌埠市蚌山区姜桥路心里程产业园7号厂房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。