Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连理工大学;大连理工大学人工智能大连研究院;大连维视科技有限公司王一帆获国家专利权

大连理工大学;大连理工大学人工智能大连研究院;大连维视科技有限公司王一帆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连理工大学;大连理工大学人工智能大连研究院;大连维视科技有限公司申请的专利一种基于动态滤波器的视频显著性目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115984747B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310013513.5,技术领域涉及:G06V20/40;该发明授权一种基于动态滤波器的视频显著性目标检测方法是由王一帆;徐松;卢湖川;王立君设计研发完成,并于2023-01-05向国家知识产权局提交的专利申请。

一种基于动态滤波器的视频显著性目标检测方法在说明书摘要公布了:本发明属于机器学习、视频目标分割、显著性目标检测领域,提供了一种基于动态滤波器的视频显著性目标检测方法。本方法的特征提取网络使用轻量化MobileV3,在保持较高精度的同时,降低模型的内存大小,提升检测速度,对检测网络部署在AI边缘设备的可行性大大提升。设计了一个基于动态滤波器的模块,使得模型的卷积核参数并不是训练好就固定的,而是会根据输入进行动态的调整,使得模型的泛化性得到了提升。同时利用视频这种数据本身的特性,进行时间一致性的约束,使得对于视频的分割结果具有稳定性。

本发明授权一种基于动态滤波器的视频显著性目标检测方法在权利要求书中公布了:1.一种基于动态滤波器的视频显著性目标检测方法,其特征在于,步骤如下: 步骤1:输入连续视频流,通过轻量化的MobileV3特征提取网络级联一个解码器获取每一帧的粗略掩码预测; MobileV3特征提取网络是使用网络架构搜索NAS出的一种针对在手机上运行高性能低资源的网络,其首先使用步长为2的卷积模块得到2倍下采样特征,再使用3层级联了卷积模块、标准化层、ReLU6激活函数、3x3深度可分离卷积、标准化层、ReLU6激活函数、1x1卷积层、标准化层的瓶颈残差模块得到包含有空间细节信息的4倍下采样特征;堆叠3层同样的瓶颈残差模块,仅将其中3x3的深度可分离卷积替换成5x5的深度可分离卷积,得到8倍下采样特征;通过6层使用了3x3深度可分离卷积的瓶颈残差结构,将原始下采样倍率从2调整到1;通过3层使用了5x5的深度可分离卷积的瓶颈残差结构,同样将原始下采样倍率从2调整到1,得到最终的8倍下采样特征;最后级联卷积模块、全局平均池化层、卷积模块以获得用于分类的特征向量,为了适应视频显著性检测任务,将最后的分类部分舍去;将得到的8倍下采样的特征经过残差模块、卷积模块、上采样后,得到具有语义信息的4倍下采样特征,与MobileV3特征提取网络最开始提取到的包含有空间细节信息的4倍下采样特征相加后经过Sigmoid函数,对每帧图像产生一个粗略的掩码预测; 步骤2:将步骤1中得到的8倍下采样的特征分别采用帧内全局注意力增强模块以及跨帧局部注意力增强模块对帧内和帧间信息进行建模,具体为: 2.1一次性输入MobileV3特征提取网络的帧数为T帧,经过MobileV3特征提取网络得到的8倍下采样后的特征图大小记作T,C,H,W,其中,T代表帧数,C代表通道数,H代表高度,W代表宽度; 2.2帧内全局注意力增强:将步骤2.1中提到的特征图分别通过三个独立的卷积层,选取点积作为衡量特征之间相似度的指标,将特征图在空间维度进行展平处理,计算出相似度矩阵,并利用其对每一点从其他空间位置提取信息,达到帧内信息建模的目的; 2.3跨帧局部注意力增强:采用local‑attention机制,对于每一个像素点对应的向量,根据时间距离选取不同大小的窗口进行注意力机制的计算; 步骤3:将经过步骤2增强后的特征图送入动态滤波器模块,进一步滤除多余的噪声,具体为: 3.1将步骤1得到的粗糙掩码预测调整分辨率后与步骤2得到的特征图在通道维度进行拼接,再经过残差模块、卷积模块得到一个新的特征图; 3.2使用多尺度的最大池化,选择三个尺度进行最大池化,记作r1,r2,r3,将池化后的特征图在空间维度进行展平并拼接,得到的特征维度为T,C,r12+r22+r32; 3.3去除步骤3.2中提取的特征点的背景噪声,首先将特征维度进行调整合并为C,T*r12+r22+r32,计算出相似度矩阵S,对每一行做softmax,然后在列上求平均,得到对每个特征的一个权重因子,利用这一权重进行加权求和,得到一个1xC的特征; 3.4利用步骤3.3得到的1xC的特征,经过全连接层,分别生成1x1大小的滤波器和3x3大小的深度可分离卷积滤波器以减小参数量;假设输入特征图的尺寸为H,W,C1,输出通道数为C2,卷积核大小为k的标准卷积核的参数量为k*k*C1*C2;卷积核大小为k的深度可分离卷积参数量为k*k*C1*1+1*1*C1*C2; 步骤4:将步骤3得到的经过动态滤波器后的特征进行上采样和浅层的特征相加,再次重复步骤3; 步骤5:将步骤4得到的特征图送入解码器,产生最终精细的掩码预测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学;大连理工大学人工智能大连研究院;大连维视科技有限公司,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。