湘潭大学许海霞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湘潭大学申请的专利一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116310305B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211515772.X,技术领域涉及:G06V10/26;该发明授权一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型是由许海霞;刘彦帮;周维;王玮;朱江;张东波;彭伟;丁凡迅;韩丰;胡开宇;许宇婷设计研发完成,并于2022-11-29向国家知识产权局提交的专利申请。
本一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型在说明书摘要公布了:本发明公开了一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型。本发明包括以下步骤:1、模型建立,设计一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型,通过在编码器中利用注意力机制学习像素点图像特征之间的关联性并增强深层语义信息,在解码器中将浅层和深层语义信息进行融合来捕获图像的上下文语义信息,以扩大不同类别物体的类间差异性。2、模型训练,首先对数据集预处理,然后对建立好的模型进行模型训练。3、模型推理,将测试集的图像输入到训练好的模型中,推理测试图像的语义类别预测值,评估测试模型推理的准确度。本发明是一种针对图像语义分割的神经网络模型,获得了在语义分割领域较好的分割效果。
本发明授权一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型在权利要求书中公布了:1.一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型,其特征在于包括以下步骤: 步骤1:模型建立; 具体设计一种基于张量和二阶协方差注意力机制的编解码结构语义分割模型,在编码器中通过注意力机制学习像素点图像特征之间的关联性并增强深层特征的语义信息,在解码器中通过将浅层语义信息和深层语义信息进行融合来捕获图像丰富的上下文语义信息,以扩大不同类别物体的类间差异性,最终提高分割准确性; 首先,建立编码器模型Encoder,对图像进行特征提取,通过骨干网络ResNet-101提取图像的浅层特征F1到深层特征F4,其中C1、C2是图像特征的通道数,H1、H2和W1、W2是图像特征的高度和宽度; 然后,建立二阶协方差注意力模型SCAM,在通道维度上捕获全局上下文信息对图像特征F4进行增强,得到具有增强语义信息的图像特征X1; 建立张量注意力模型TAM,对图像特征X1的上下文信息从空间维度和通道维度进行聚合,得到语义辨别力更强的图像特征图X2; 最后,建立解码器模型Decoder,对X2进行上采样得到特征图X3,通过对浅层特征F1和特征图X3进行融合,得到上下文关联性增强的特征图,并对融合后的特征图进行上采样,通过双线性插值得到图像的语义预测图Y; 其中,建立的二阶协方差注意力模型SCAM,其特征在于: 利用二阶统计量和局部跨通道交互策略,从通道维度增强图像特征辨别力,具体操作为: 首先计算两个特征图之间的二阶统计量协方差: 式中Cov.表示协方差运算; 再利用分组卷积设计局部跨通道交互策略,计算出不同通道语义特征的重要性,最后通过乘法逐通道加权到输入的图像特征F4,完成在通道维度上对语义特征的重标定: X1=sigmoidC1DkGroupc×1M⊙F42 式中C1Dk.表示卷积核长度为k的一维卷积,Groupc×1.表示卷积核大小为c×1的分组卷积,⊙表示沿着通道维度的缩放乘法,M为二阶协方差矩阵, 建立的张量注意力模型TAM,其特征在于: 通过引入偏置可学习参数张量A,计算特征图不同通道不同空间位置的注意力权重系数,将经典的非局部注意力S矩阵扩展为注意力张量Z1,更好地辨别不同位置不同通道的语义特征,具体运算如下: Q=ConvX1;K=ConvX1;V=ConvX13 S=SoftmaxQT×K4 A=SoftmaxConvX15 Z=A◎S6 X2=V×Z1 T8 式中◎表示矩阵S的每一行向量乘以参数矩阵A中的一个元素, Conv.表示卷积核大小为1×1的卷积,表示使用广播机制的矩阵加法,T为矩阵的转置; 步骤2:模型训练; 对步骤1所建立的模型进行训练,训练到整个模型收敛为止; 步骤3:模型推理; 将测试集的图像输入到训练好的模型中,推理测试图像的语义类别预测值,评估预测准确度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湘潭大学,其通讯地址为:411105 湖南省湘潭市雨湖区湘潭大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。