南京林业大学赵亚琴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京林业大学申请的专利基于轻量级长短距离注意力transformer网络的火灾图像检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115171047B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210852895.6,技术领域涉及:G06V20/52;该发明授权基于轻量级长短距离注意力transformer网络的火灾图像检测方法是由赵亚琴;赵文轩设计研发完成,并于2022-07-20向国家知识产权局提交的专利申请。
本基于轻量级长短距离注意力transformer网络的火灾图像检测方法在说明书摘要公布了:一种基于轻量级长短距离注意力transformer网络的火灾图像检测方法,先采集火焰图片;再使用火焰检测网络进行检测,步骤包括:1利用设计的轻量级特征提取主干网络处理输入待检测火焰图片,并输出提取到的三个不同分辨率的多尺度火焰特征;2构建基于BiFPN的特征融合网络对前述多尺度火焰特征进行特征融合处理,并输出融合了三个不同分辨率层的融合特征;3网络的分类层对前述融合特征进行分类预测,判断火焰的存在及其在图像中的位置。本发明中:轻量级的主干网络结构提高了检测速度;长短注意力机制的transformer提高了检测精度;特征融合机制BiFPN,提高了检测火灾图像中小目标火焰的能力,这提高了早期火灾和远距离拍摄的火灾图像的识别准确率。
本发明授权基于轻量级长短距离注意力transformer网络的火灾图像检测方法在权利要求书中公布了:1.一种基于轻量级长短距离注意力transformer网络的火灾图像检测方法,步骤包括:先采集火焰图片;然后使用火焰检测网络进行检测;其特征是使用火焰检测网络检测火焰图片的步骤包括: 1利用设计的轻量级特征提取主干网络处理输入待检测火焰图片,并输出提取到的三个不同分辨率的多尺度火焰特征; 2构建基于BiFPN的特征融合网络对步骤1得到的多尺度火焰特征进行特征融合处理,并输出融合了三个不同分辨率层的融合特征; 3火焰检测网络的分类层对步骤2得到的融合特征进行分类预测,判断火焰的存在以及其在图像中的位置; 所述步骤1中: 1.1使用一个标准卷积模块对输入火焰图片中的火焰特征进行特征预提取,建立一个可供网络学习的初始化特征张量; 1.2使用四组深度可分离卷积模块对初始化特征张量进行深度特征提取,并缩减火焰特征图的尺寸,四个深度可分离卷积模块分为两个深度卷积步长为1的不改变特征图尺寸的深度分离卷积模块和两个深度卷积步长为2的减半特征图尺寸的深度可分离卷积模块; 1.3将transfromer模块引入到深度可分离卷积模块,构建基于长短距离注意机制的轻量级transformer模块;transformer模块用于在不受拍摄距离的影响的前提下提取火焰图像的全局特征; 1.4将三组依次串行连接的长短距离注意机制轻量级transformer模块嵌入到火焰特征提取主干网络,提取火焰图像的局部和全局特征; 1.5每一组长短距离注意机制的轻量级transformer模块都使得输入的火焰特征图的尺寸减半,并将该分辨率层的火焰特征图输出至特征融合模块; 通过步骤1.4和步骤1.5处理当前图片的火焰特征图之后,得到三个不同分辨率的火焰特征图,并将这三个不同分辨率的火焰特征图送入步骤2进行处理; 所述步骤2中: 2.1在特征融合网络中,将步骤1.4得到的三个不同分辨率火焰特征图先从低往高、再从高往低依次进行反卷积上采样和池化下采样,并将输入与输出级联,进而融合不同卷积层火焰特征信息; 2.2重复步骤2.1两次,最终得到三个待检测火焰的特征图; 步骤1.3中,使用transformer机制为深度可分离卷积模块添加全局注意力,构建基于长短距离注意机制的轻量级Transformer模块,步骤包括: 1.3.1对于输入的火焰特征图经过一个3×3卷积层和一个1×1卷积层进行局部特征表达;然后对处理后的特征进行通道分离操作,沿着通道维度将火焰特征平均分为两个尺寸完全相同的火焰特征图; 1.3.2并行处理: a、使用一个深度可分离卷积模块对进行局部特征信息提取,输出特征图的每一个像素仅获得感受野范围内的特征信息,即获得局部注意力;每一个像素所能获得的局部感受野尺寸的计算方法用公式1计算: 1 其中,表示第层卷积核的尺寸,表示第层的步长; b、使用一个Transformer模块对进行全局注意力信息提取,输出特征图的每一个像素均获得输入特征图的所有像素的信息,步骤包括: 首先,对于输入火焰特征,先将它分成个彼此不重叠的图块,其中,; 接着对所有的图块进行词向量嵌入转化成的词向量并添加位置编码,并将所有的词向量拼接,得到; 然后,对于每一个词向量,通过三个权值矩阵,,,转变成计算注意力所需要的查询向量、键向量和值向量;注意力计算方法为: 最后,对输出的注意力序列进行反编码获得和原始输入特征尺寸相同的全局注意力图; 1.3.3将a、b两个并行分支的输出特征图进行级联,并通过一个1×1卷积层和一个3×3卷积层进行通道还原。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京林业大学,其通讯地址为:210037 江苏省南京市玄武区龙蟠路159号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励