湖南大学张辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南大学申请的专利一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120707569B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511195259.0,技术领域涉及:G06T7/00;该发明授权一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法是由张辉;刘航;别克扎提·巴合提;曹意宏;杜瑞;吴读桑;王耀南;毛建旭设计研发完成,并于2025-08-26向国家知识产权局提交的专利申请。
本一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法在说明书摘要公布了:本发明公开了一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法,通过将电力场景图像输入检测模型,然后由骨干网络提取初始特征图,再对初始特征图按卷积路径来执行多阶段特征提取,接下来将多阶段特征基于路径聚合网络处理,输出多张具有由浅到深不同特征层级的融合特征图;并基于跨尺度窗口注意力,以相邻的每两张融合特征图中具有高语义的深层融合特征图来引导浅层融合特征图进行语义信息建模,得到多张输出特征图后,采用多分支检测头分别处理并输出预测结果。本发明融合浅层特征激活预测与跨尺度窗口注意力引导,能够实现有效提升无人机巡检图像中微小故障目标的检测鲁棒性与定位精度。
本发明授权一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法在权利要求书中公布了:1.一种基于高斯掩码监督和跨层注意力引导的电力场景缺陷小目标检测方法,其特征在于,包括: 步骤1,将电力场景图像输入检测模型,然后由检测模型的骨干网络首先提取初始特征图,再对初始特征图按卷积路径来执行多阶段特征提取,并分别输出每个阶段所获得的特征图,从而得到不同尺度上的多个特征图,且基于阶段的顺序所形成的特征图依次为由浅到深的浅层特征图和深层特征图; 步骤2,基于路径聚合网络,先采用自顶向下路径,将步骤1每两张相邻阶段获得的特征图中的深层特征图进行上采样后与浅层特征图进行拼接,得到多张具有由深到浅不同特征层级的中间特征图;然后再采用自底向上路径,对每两张相邻中间特征图中的浅层中间特征图进行下采样后与深层中间特征图进行拼接,最终输出多张具有由浅到深不同特征层级的融合特征图; 步骤3,基于跨尺度窗口注意力,以相邻的每两张融合特征图中具有高语义的深层融合特征图来引导浅层融合特征图进行语义信息建模,即基于深层融合特征图生成键向量Key和值向量Value,并基于浅层融合特征图生成查询向量Query,然后对Key、Value和Query划分窗口,再通过投影矩阵拆分为多头,然后引入相对位置偏置来计算Query和Key的多头注意力,得到的多头注意力结果与Value的多头相乘,再拼接后经输出投影矩阵映射得到输出,输出经通道门控处理后与浅层融合特征图相加后作为输出特征图;最终得到多张输出特征图; 步骤4,对步骤3得到的多张输出特征图,采用多分支检测头分别处理并输出预测结果; 所述步骤3包括: 采用下式来基于相邻的每两张融合特征图中具有高语义的深层融合特征图生成键向量Key和值向量Value: 其中K表示Key,V表示Value,表示实数矩阵,C表示K和V的通道数,H表示K和V的高,W表示K和V的宽,表示深层融合特征图,split·表示沿通道维度切分为通道数量相等的两部分,φk,v·包含上采样与1×1卷积投影,↑·为最近邻插值上采样; 采用下式来基于相邻的每两张融合特征图中的浅层融合特征图生成查询向量Query: 其中Q表示Query,φq·表示1×1卷积投影;表示浅层融合特征图,然后将Q、K、V划分为Nw个不重叠窗口: 其中S为窗口尺寸,H2和W2分别表示深层融合特征图的高和宽; 然后根据每个窗口内对应的查询矩阵Qw、键矩阵Kw和值矩阵Vw来计算多头注意力,则对于第m个头有: 其中Qm、Km和Vm分别为经过投影矩阵处理后的第m个头的查询矩阵、键矩阵和值矩阵;和分别为查询投影矩阵、键投影矩阵和值投影矩阵,均是模型中通过学习获得的参数,dh为注意力头的维度,dh=C2M,C2表示深层融合特征图F2的通道数,M为多头的头数,和分别表示窗口内第m个头的查询矩阵、键矩阵和值矩阵; 再引入通过学习获得的相对位置偏置B,来计算Q和K的注意力矩阵Attnm,其中B用于弥补注意力机制的位置不敏感性, 其中Softmax表示softmax归一化函数,的上标T表示矩阵转置,B表示第m个头的位置偏置; 再将Attn与对应的V相乘,得到第m个头的结算结果Z,然后合并所有头的结算结果,并经过输出投影W映射后得到融合注意力增强特征Z: =Attn Z=concatZ,…,ZW 其中W为输出投影矩阵,最终通过门控残差连接融合注意力增强特征Z与原始的浅层融合特征图得到由相邻的每两张融合特征图获得的输出特征图: 其中为输出特征图,Sigmoid表示Sigmoid非线性激活函数,g·为通道注意力门控,⊙表示逐元素相乘。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路麓山门;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励