重庆邮电大学宋铁成获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于视觉Transformer的头部姿态估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119445619B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411566435.2,技术领域涉及:G06V40/10;该发明授权一种基于视觉Transformer的头部姿态估计方法是由宋铁成;刘淳;秦安勇;杨烽;赵悦;高陈强设计研发完成,并于2024-11-05向国家知识产权局提交的专利申请。
本一种基于视觉Transformer的头部姿态估计方法在说明书摘要公布了:本发明属于计算机视觉领域,具体涉及一种基于视觉Transformer的头部姿态估计方法,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块;本发明通过图像翻折操作引入翻折图像,能够为原图像提供自监督信息,通过这种方式,模型可以学习到姿态变化的反向特征,使得模型能够捕捉到不同姿态下的相似性,进一步提升头部姿态估计的准确度和稳定性。
本发明授权一种基于视觉Transformer的头部姿态估计方法在权利要求书中公布了:1.一种基于视觉Transformer的头部姿态估计方法,其特征在于,包括:构建头部姿态估计模型;获取待检测的图像,将图像输入到训练后的头部姿态估计模型中,得到头部姿态估计结果;所述头部姿态估计模型包括视觉Transformer预训练网络模块、多尺度Transformer编码器模块、CNN模块以及预测头模块; 对头部姿态估计模型进行训练包括:获取头部姿态数据集,并对数据集中的数据进行随机尺度变换,得到训练集;将训练集中的数据进行翻转,将原始图像和翻转后的图像分别输入到视觉Transformer预训练网络模块和CNN模块进行特征提取,得到对应的特征序列化表示;对特征序列化表示加入可学习的d维向量,得到融合序列;将融合序列输入到多个多尺度Transformer编码器模块中,通过多尺度交互策略和图像增强策略,得到交互后的特征向量;将交互后的特征向量与CNN模块提取的特征向量进行融合;将原始图像的融合特征和翻转图像的融合特征转换为旋转矩阵,将翻折后图像的旋转矩阵与可学习矩阵相乘后与原图像的旋转矩阵进行融合;将融合后的旋转矩阵输入到预测头模块,得到头部姿态估计结果;计算模型的损失函数,调整模型参数,当损失函数值最小时完成模型的训练; 将交互后的特征向量与CNN模块提取的特征向量进行融合包括:通过将翻折图像预测旋转矩阵与可学习权值矩阵相乘后与原图像预测旋转矩阵融合;融合后3D预测旋转矩阵Mg为: 其中W为可学习权值矩阵,Mx为翻折图像预测旋转矩阵,My为原图像旋转预测矩阵; 通过对原图像预测旋转矩阵与翻折图形预测旋转矩阵施加测地线距离作为两个旋转矩阵之间的损失,对比损失为: 其中M1为原图像预测旋转矩阵,M2为翻折图像预测旋转矩阵,tr为求矩阵的迹; 真实预测损失为: 其中,M为真实旋转矩阵,Mg为融合后预测旋转矩阵; 方向令牌损失为: 其中,11为基本方向区域的数量,M为真实旋转矩阵,Mi为第i个区域的预测旋转矩阵,IM,i是一个指示函数; 总损失为: L=αL1+βLg+1-βLori 其中,α和β表示超参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励