合肥工业大学杨依忠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利一种基于多尺度膨胀卷积编码-解码的运动目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117197183B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311179071.8,技术领域涉及:G06T7/215;该发明授权一种基于多尺度膨胀卷积编码-解码的运动目标检测方法是由杨依忠;夏婷婷;张景润设计研发完成,并于2023-09-13向国家知识产权局提交的专利申请。
本一种基于多尺度膨胀卷积编码-解码的运动目标检测方法在说明书摘要公布了:本发明公开了一种基于多尺度膨胀卷积编码‑解码的运动目标检测方法,包括:1、构建多信息视频序列集合,2、搭建具有多尺度膨胀卷积的编码‑解码模型,3、训练网络模型,4、测试网络模型。本发明能解决传统编码器‑解码器中细节特征不能传递更深层、只能检测简单场景等问题,从而能快速准确地在现实复杂场景中提取到前景目标尤其是受背景信息影响的小目标物体检测,进而能提高对前景目标的检测能力。
本发明授权一种基于多尺度膨胀卷积编码-解码的运动目标检测方法在权利要求书中公布了:1.一种基于多尺度膨胀卷积编码-解码的运动目标检测方法,其特征在于,是按照如下步骤进行: 步骤1、构建多信息视频序列集合; 步骤1.1、从具有像素级标签的视频数据中,选取T段视频序列,并对视频序列中每帧图像进行归一化处理,从而得到归一化后的视频序列集合S={S1,S2,...,St,...,ST},St表示第t段视频序列,且fit为第t段视频序列St中的第i帧图像,M为每段视频序列中图像帧的数量;定义第t段视频序列的真实像素级标签记为Yt∈{0,1}; 步骤1.2、利用时间中值滤波分别对中前X帧和前Y帧图像进行处理,得到第t段“空”视频序列S′t和第t段最近视频序列S″t;1XYM; 步骤1.3、利用预训练后的HRnet网络分别对St,S′t,S″t进行处理,相应得到第t段原始语义信息视频序列Ft、第t段“空”语义信息视频序列Ft′、第t段最近语义信息视频序列Ft″; 步骤1.4、构建第t段多信息视频序列Ct={St,S′t,S″t,Ft,Ft′,Ft″}; 步骤2、搭建多尺度膨胀卷积编码-解码网络,包括:多尺度膨胀卷积编码模块、特征增强和细节处理模块、特征解码模块; 步骤2.1、构建所述多尺度膨胀卷积编码模块是由N个编码块串联而成,每个编码块由一个膨胀卷积块和一个卷积块连接而成;所述膨胀卷积块包括:a层不同膨胀率的并行卷积层;a层卷积层的输出相加后经过Dropout层的处理再输入后续的卷积块中;所述卷积块依次由卷积层、BN层、以及ReLU层串联而成; 所述第t段多信息视频序列Ct输入多尺度膨胀卷积编码模块中进行处理,得到N个编码块输出的第t段多尺度编码特征序列Ot={Ot1,Ot2,...,Otn,...,OtN};其中,Otn表示第n个编码块输出的多尺度编码特征; 步骤2.2、构建所述特征增强与细节处理模块是由N个特征处理块并联而成;每个特征处理块是由一个并行注意力模块和一个细节处理模块并联而成;其中,并行注意力模块由位置注意力单元和通道注意力单元并联而成; 步骤2.2.1、第n个特征处理块中的并行注意力模块位置注意力单元对Otn进行处理,得到第n个位置融合特征Etn; 步骤2.2.2、第n个通道注意力单元对Otn进行处理,得到第n个通道融合特征 步骤2.2.3、将Etn与通过线性相加后输入卷积层处理,得到第n个并行注意力模块输出的第n个位置-通道融合特征Htn; 步骤2.2.4、所述细节处理模块对Otn进行处理得到的第n细节处理特征SCtn; 步骤2.2.5、第n个位置-通道融合特征Htn与第n个细节处理特征SCtn相加后得到第n个特征处理块输出的第n个信息增强特征HSCtn;从而得到特征增强与细节处理模块输出的第t段信息增强特征序列HSCt={HSCt1,HSCt2,...,HSCtn,...,HSCtN}; 步骤2.3、所述特征解码模块由N个反卷积模块和Sigmoid层构成,每个反卷积模块依次由反卷积层,BN层,卷积层,BN层,ReLU层串联组成; 将第N个信息增强特征HSCtN送入第N个反卷积模块中进行处理后,得到的结果与HSCtN-1线性相加,再将相加后的结果送入第N-1个反卷积模块中进行处理后,得到的结果与HSCtN-2线性相加,依此类推,将最终相加后的结果送入第1个反卷积模块中进行处理后,得到的结果送入Sigmoid层的处理,从而得到第t段多信息视频序列Ct预测的逐像素前景概率 步骤3、训练网络: 步骤3.1、利用式1建立预测前景概率与像素级标签Yt之间的第t个损失 式1中,e是平滑参数,m,n是空间像素位置; 步骤3.2、基于T段多信息视频序列{Ct|t=1,2,...,T},利用Adam优化器将T个损失反向传播至多尺度膨胀卷积编码-解码网络中,并不断更新网络参数,直至损失函数趋向收敛,得到训练后的多尺度膨胀卷积编码-解码模型; 步骤4、利用训练后的多尺度膨胀卷积编码-解码模型对待预测的间歇性物体运动图像进行处理,得到间歇性物体运动图像所对应的逐像素前景概率; 设置阈值P,将每一个像素的逐像素前景概率与阈值P相比较,从而将大于阈值P的像素设为前景像素,其余的像素设为背景像素,并得到待预测的间歇性物体运动图像中运动目标分割结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励