杭州电子科技大学佘青山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种基于RGB图像的轻量化三维手部姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115880724B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211628762.7,技术领域涉及:G06V40/10;该发明授权一种基于RGB图像的轻量化三维手部姿态估计方法是由佘青山;陈炫琦;马玉良;席旭刚设计研发完成,并于2022-12-17向国家知识产权局提交的专利申请。
本一种基于RGB图像的轻量化三维手部姿态估计方法在说明书摘要公布了:本发明涉及一种基于RGB图像的轻量化三维手部姿态估计方法,首先,使用多个sandglass残差块串联堆叠,用于进行局部的特征建模。其次,在部分sandglass残差块之后,对特征进行“展开”操作,并以Transformer块结构进行全局的特征建模,再对特征进行“折叠”,并进行特征融合。然后,在Transformer块中引入可分离自注意力机制,降低自注意力的计算复杂度。最后,将特征图通过卷积得到二维手部姿态热图,两者拼接后通过卷积得到关节向量图,再次拼接后再通过卷积得到三维手部姿态热图,最终实现三维手部姿态估计。本发明从RGB图像中直接估计三维手部姿态,并且能够在具有较高的估计精度的同时保持优良的计算效率,能够在人机交互、虚拟现实、手势识别等领域具有广阔的应用前景。
本发明授权一种基于RGB图像的轻量化三维手部姿态估计方法在权利要求书中公布了:1.一种基于RGB图像的轻量化三维手部姿态估计方法,其特征在于:包括以下步骤: 步骤一:将多个sandglass残差块串联堆叠,保证卷积所具有的归纳偏置特性,用于局部的特征建模; 所述步骤一具体包括: 引入了sandglass残差块结构,其中主分支中的第一个和最后一个卷积层是保留通道数不变的深度可分离卷积层,模拟经典的瓶颈块结构,在两个深度可分离卷积之间使用两个连续的逐点卷积堆叠,先减少后再增加通道数,因为1×1的逐点卷积会导致空间信息的减弱,将两个3×3的卷积置于两个1×1的卷积之外,并适当地将两个深度可分离卷积应用到更高维度的特征上,从而可以对更丰富的空间信息进行编码,以生成更具表现力的空间信息, 表示输入特征,表示输出特征,采用如下公式表示: 其中,φi,p,φi,d分别表示第i个逐点卷积与深度卷积,确保深度卷积在高维空间处理并得到更丰富的特征表达; 步骤二:对特征进行“展开”操作,再以Transformer块结构进行全局的特征建模,再对特征进行“折叠”,并进行特征融合; 所述步骤二具体包括: 将sandglass块输出作为d维的输入特征应用一个n×n标准卷积层,再用1×1的点卷积层产生特征XL,让模型具有空间归纳偏置的全局表示,将特征XL展开为N个不重叠的patch,用表示,P=wh,而是patch的数量,h≤n和w≤n分别是patch的高度和宽度,根据式3,对于每个patch,即p∈{1,···,P},通过Transformer对patch间的关系进行编码从而得到 XGp=TransformerXUp,1≤p≤P3 可以折叠得到使用逐点卷积将XF投影到低维空间,并通过级联操作与特征X组合,使用另一个n×n卷积层来融合这些连接的特征,对特征XUp使用卷积对n×n区域的局部信息进行编码,XGp对第p个位置的patch的全局信息进行编码,XG中的每个像素都可以编码来自X中所有像素的信息,总的有效感受野为H×W; 步骤三:在用于全局特征建模的Transformer块中引入可分离自注意力机制,降低自注意力的计算复杂度; 所述步骤三具体包括: 可分离自注意力的结构与Transformer中使用的多头自注意力类似,将Transformer的输入Xinput分别使用输入I、键K和值V三个分支处理,输入分支I使用具有权重WI的线性层将Xinput中的每个d维token映射为标量,权重WI用来表示潜在token与Xinput间的距离,从而产生一个k维向量,然后使用softmax函数以产生上下文分数与针对所有k个token计算每个token的注意力分数不同,可分离自注意力仅计算关于潜在token的注意力分数,这样可以使得计算注意力分数的时间复杂度从Ok2下降到Ok; 由式4,上下文向量Cv通过上下文分数Cs得到,其中由具有权重的键分支K将输入Xinput线性投影到d维空间后得到, Cv中编码的上下文信息与Xinput中的所有token共享,使用权重为WV的值分支V将输入Xinput线性投影到d维空间然后使用ReLU激活函数后产生输出将得到的输出馈送到具有权重的另一个线性层后产生最终输出 步骤四:将特征图通过卷积得到二维手部姿态热图,两者拼接后通过卷积得到关节向量图,再次拼接后再通过卷积得到三维手部姿态热图,最终实现三维手部姿态估计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘新区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。