西北大学陈莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北大学申请的专利一种结合注意力并行分支结构的戏剧人物姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116524589B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310336824.5,技术领域涉及:G06V40/20;该发明授权一种结合注意力并行分支结构的戏剧人物姿态估计方法是由陈莉;谢飞;高涵;郝星星;翟洪颢;刘伟设计研发完成,并于2023-03-31向国家知识产权局提交的专利申请。
本一种结合注意力并行分支结构的戏剧人物姿态估计方法在说明书摘要公布了:本发明公开了一种结合注意力并行分支结构的戏剧人物姿态估计方法:步骤一,对公开数据集MSCOCO数据集进行预处理,预处理具体为数据增强操作,将预处理后的数据集作为训练集;步骤二,构建基于注意力机制的并行分支高分辨率网络模型;步骤三,采用训练集对基于注意力机制的并行分支高分辨率网络模型进行训练,得到训练好的基于注意力机制的并行分支高分辨率网络模型;步骤四,对待估计的戏剧人物姿态图像进行预处理,预处理具体为统一尺寸操作;步骤五,将预处理后的待估计图像输入训练好的基于注意力机制的并行分支高分辨率网络模型,得到估计姿态结果。本发明的方法增强了网络模型的特征表达能力,实现了对被遮挡关节点的精准定位。
本发明授权一种结合注意力并行分支结构的戏剧人物姿态估计方法在权利要求书中公布了:1.一种基于注意力机制的并行分支高分辨率网络模型构建方法,其特征在于,包括如下步骤: 步骤1,构建基于通道域和空间域的混合注意力模块; 混合注意力模块使用串行的通道域注意力模块和两个相同且连续的空间域注意力模块实现; 通道域注意力模块的输入为局部特征图S,空间维度满足,c为局部特征图S的通道数,w和h分别为局部特征图S的宽度和高度;首先对局部特征图S分别使用全局最大池化和全局平均池化,将其结果分别进行1×1卷积、Relu激活、1×1卷积之后,使用对应元素相加的方式进行特征聚合,得到通道关联关系矩阵,其维度为c×1×1;然后使用Sigmoid激活函数将通道关联关系矩阵中的数值映射到0-1之间,得到通道关联权重矩阵W,之后将通道关联权重矩阵W以对应元素相乘的方式作用于初始局部特征图S,得到初始通道域注意力输出I;最后将I与S进行残差连接得到最终通道域注意力模块输出的局部特征图SS; 空间域注意力模块的输入为通道域注意力模块输出的局部特征图SS,空间大小满足;首先使用1×1卷积对局部特征图SS进行通道数调整,得到Q和K特征矩阵,,其中为对应数据集关节数量;然后通过Affinity仿射变换生成初始注意力图D;初始注意力图D经过Softmax激活函数之后得到交叉注意力矩阵A;同时,由通道域注意力模块输出的局部特征图SS经一次1×1卷积得到特征图V; 然后,将特征图V和交叉注意力矩阵A按照下式进行特征聚合: 其中为特征图V在任意位置u所在行和列的特征值构成的二维向量,行和列方向值依次编号后作为列向量,通道方向值作为行向量;为交叉注意力矩阵A在位置u处通道方向向量;为空间注意力模块的输入SS特征图在位置u的通道维度向量分量; 最后,将特征图与特征图SS进行特征融合,得到一次空间注意力模块的输出的特征图M; 混合注意力模块中第二个空间注意力模块以第一个空间注意力模块的输出特征图M作为输入,将其替代特征图SS进入第二个空间注意力模块,进行与第一个空间注意力模块相同的操作,以此得到通道注意力模块的最终输出特征图N; 步骤2,根据步骤1的结果,构建基于注意力机制的并行分支高分辨率网络, 包括如下子步骤: 步骤21,将HRNet的第二个stage的第一个卷积层的输出作为第一个混合注意力模块的输入,得到第一个混合注意力模块的输出; 将HRNet的第三个stage的第一个卷积层的输出作为第二个混合注意力模块的输入,得到第二个混合注意力模块的输出; 将HRNet的第四个stage的第一个卷积层的输出作为第三个混合注意力模块的输入,得到第三个混合注意力模块的输出; 每一个混合注意力模块输出特征图的通道数都与最高分辨率子网络通道数保持一致; 步骤22,假设最高分辨率子网络通道数为c,将第一个通道注意力模块的输出特征图经过两次残差单元进行特征细化,与第二个通道注意力模块的输出特征图使用concate操作进行特征聚合,此时的特征图通道数为2c,然后使用一次1×1卷积进行通道数调整,得到通道数为c的特征图,再使用一次残差单元进行特征细化后,与第三个注意力块输出concate操作进行特征聚合,此时的特征图通道数为2c,然后使用一次1×1卷积进行通道数调整,得到通道数为c的特征图;再使用一次残差单元进行特征细化; 步骤23,将原HRNet网络的最终输出特征图作为第四个混合注意力模块的输入特征图,与步骤22得到的特征图使用concate操作进行特征聚合,此时的特征图通道数为2c,然后使用一次1×1卷积进行通道数调整,得到通道数为c的特征图,再使用一次残差单元进行特征细化后得到最终的特征图,将此特征图作为戏剧人物姿态估计网络的输出特征图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北大学,其通讯地址为:710069 陕西省西安市太白北路229号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励