重庆邮电大学胡敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于多视点几何的三维人体姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116206328B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211669053.3,技术领域涉及:G06V40/10;该发明授权一种基于多视点几何的三维人体姿态估计方法是由胡敏;杜蔻;黄宏程设计研发完成,并于2022-12-23向国家知识产权局提交的专利申请。
本一种基于多视点几何的三维人体姿态估计方法在说明书摘要公布了:本发明涉及一种基于多视点几何的三维人体姿态估计方法,属于计算机视觉领域。该方法包括:S1:对人体骨骼序列和多个摄像机视图之间的交互进行建模,即使用预先训练好的二维自底向上姿态估计器来定位每个摄像机视图中的2D人体关键点;S2:利用基于混合注意力机制的图匹配网络来捕获上下文信息,在不同的视图中匹配出相同的人体并学习捕获多个视图之间的关系,以便对截断的视角进行预测。本发明解决了从多个标定的摄像机视图恢复三维人体姿态的任务中,视图特征融合有效性较差、匹配算法无法捕获多视图关系的问题,同时显著降低了模型的计算复杂度。
本发明授权一种基于多视点几何的三维人体姿态估计方法在权利要求书中公布了:1.一种基于多视点几何的三维人体姿态估计方法,其特征在于,该方法具体包括以下步骤: S1:对人体骨骼序列和多个摄像机视图之间的交互进行建模,即使用预先训练好的二维自底向上姿态估计器来定位每个摄像机视图中的2D人体关键点; S2:利用基于混合注意力机制的图匹配网络来捕获上下文信息,在不同的视图中匹配出相同的人体并学习捕获多个视图之间的关系,以便对截断的视角进行预测; 其中,基于混合注意力机制的图匹配网络的输入为初始局部特征,通过交替进行图像内的自注意力和图像间的交叉注意力操作,根据图像上下文和相对位置不断更新特征描述符,最终使图匹配网络能够结合全局信息可学习的进行特征匹配,输出关键点之间的相似度;随后将同一个人在不同视图中的关键点匹配,利用回归网络对人体姿势回归到3D空间; 基于混合注意力机制的图匹配网络具体包括:首先将人体骨骼关键点和描述符编码成向量,分别在单视图中和视图之间交替使用自注意力和交叉注意力,随后利用自注意力以及交叉注意力来来回增强的特征匹配性,充分利用关键点的空间关系和视觉外观在不同视图之间对同一个人体的骨骼进行匹配,最后通过计算特征匹配向量的内积得到匹配度得分矩阵,然后通过Sinkhorn算法解出最优特征分配矩阵; 通过充分利用跨视图几何约束,引入上下文信息和结构感知一致性检查作为学习目标,以端到端的形式训练网络执行人体关键点的上下文聚合,匹配的任务; 当被要求匹配给定的模糊关键点时,给定图像对,在单个视图中构建无向图 来表示有M个关键点及N个骨架序列,其中,分别为图像中人体关键点的集合以及由关键点组成的边集合;点集合,其中每个节点包含一个表示其属性的,边集合包含两种类型的无向边:连接视图内关键点的边, 其中,将人体骨骼关键点 和其连接组成的树状图结构;两两视图间的边,其中为空间中人体关节连接的集合,将单个视图中的关键点 连接到其他视图中的所有关键点;在图像内部和图像之间的编码关键点和描述符上构造一个完整的图结构,并使用多头注意力机制更新它们的节点表示;构造和初始化的过程表示如下: a 编码层:通过将视图中人体关键点的外观和几何信息嵌入到图结构中,使图匹配网络能够利用关键点几何结构的“上下文”信息,并对各视图中关键点特征之间的交互进行建模;关键点的初始表示结合了测到的2D外观特征以及位置信息,因此首先利用多层感知器MLP来编码关键点和边的位置信息,将各个视图中的关键点特征映射到高维特征空间中,便于后续在向量空间中对各视图进行外观特征和结构信息的充分挖掘: 其中,为关键点的视觉描述符;为关键点的位置描述符人体关节位置信息表示为,其中为空间坐标, 为骨骼关键点置信度,因此 ,视图中将它们联合称为局部特征; b 传播层:考虑一个完整的图,它的节点是两个图像的关键点;图有两种类型的无向边——图像内的边,将关键点 连接到同一图像内的所有其他关键点;图像间的边,将关键点 连接到其他图像中的所有关键点;图神经网络从每个节点的高维状态开始,沿这两种类型的边传播信息,将一组节点表示映射到新的节点表示,并通过同时聚合所有节点的所有给定边的消息,在每一层计算更新的表示; 令 为图像上第个元素在第层的中间表达形式,表示串联操作,信息是利用自我注意力以及交叉注意力对所有特征点进行聚合之后的结果,其中: c 聚合层:通过混合注意力机制来执行多视图特征的聚合 ,图像内的边基于自注意力机制,图像间的边则基于交叉注意力机制;类似于数据库检索,的表示,即查询,根据某些元素的属性检索它们的值;该消息被计算为加权平均值,其中,注意力权重是查询与检索到对象键值相似度的,即: 此处的对应于待查询图像上某个特征点的一种表示,以及都是来自于召回的图像特征点的一种映射,表示这两个特征相似度,它是由以及计算得到; 对于自我注意,和来自相同视图的输入,因此自注意力负责图像中的特征提取,并且将远距离信息融入到对应的特征空间中;对于交叉注意力来自图像对中另一视图的输入;最终的预测由图神经网络的最后一层计算,并且将匹配描述符设计为单个线性投影: 每个图层都有自己的投影参数,学习和共享两个图像的所有关键点; d 匹配层:通过计算特征匹配向量的内积得到匹配度得分矩阵,然后通过Sinkhorn算法解算出最优特征分配矩阵;匹配层分为两步执行;首先通过计算每对特征之间的非归一化余弦相似度,构造一个得分矩阵,第二步则是计算包含每对特征匹配概率的软赋值矩阵,中的每一行和每一列都分别对应 和 中的一个人体骨骼关键点,最后一列和最后一行则表示一个“垃圾箱”,用于滤除不匹配的关键点,因此被扩展为,其中所有新元素都使用可学习参数进行初始化,将最优赋值转化为使和最大化,限制如下: 将不同视图中相同关机按点匹配的问题转化为最优传输问题,用Sinkhorn算法以一种快速和可微分的方式求和;经过T=100次的迭代之后,得到的软赋值矩阵。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区黄桷垭崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励