Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州电子科技大学邵艳利获国家专利权

杭州电子科技大学邵艳利获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州电子科技大学申请的专利一种基于零件定位的行人分组属性识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116977688B

龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211738009.3,技术领域涉及:G06V10/764;该发明授权一种基于零件定位的行人分组属性识别方法是由邵艳利;应勇;王兴起;魏丹;陈滨;方景龙设计研发完成,并于2022-12-30向国家知识产权局提交的专利申请。

一种基于零件定位的行人分组属性识别方法在说明书摘要公布了:本发明公开了一种基于零件定位的行人分组属性识别方法。本发明首先受到空间变化网络的启发,提出一个零件定位模块,可以在没有身体部位或位置等先验知识的情况下定位出单个行人的头部区域、躯干区域和腿部区域三个主要部位,并结合属性的空间关系特征将分组后的属性对应零件定位的区域,有效缩小关注区域以提高属性识别的准确性。其次,设计了一种加权的Focalloss损失函数以解决行人属性数据不平衡问题,设计了定位损失函数以提高零件定位模块的准确性。最后,在此基础上提出了一个基于ResNet50的端到端的行人属性识别框架。

本发明授权一种基于零件定位的行人分组属性识别方法在权利要求书中公布了:1.一种基于零件定位的行人分组属性识别方法,其特征在于,该方法具体包括以下步骤: 步骤1、对PETA、PA100k和RAP行人属性数据集中的原始数据进行预处理,对原始数据进行数据增强和属性分组; 步骤2、利用步骤1预处理后的数据,输入到主干网络Resnet50中,得到全局特征分支,具体操作如下: 全局特征分支是基于整体区域的属性识别,经过resnet50的conv1-4模块特征提取特征后会得到2048×4×8维的全局特征,使用全局平均池化的方式; 步骤3、利用步骤2中主干网络Resnet50提取的特征,输入到零件定位模块,得到局部特征分支,并预测其对应属性;具体操作如下: 主干网络resnet50提取的全局特征经过零件定位模块中的变换会得到一个1×4维的特征,零件定位模块中包含的空间变换网络会根据这个1×4维的特征对原始行人图像进行下采样操作,输出行人的头部区域、躯干区域和腿部区域三个区域的图像,相对应的是头部、躯干和腿部三个分支;根据步骤1中的数据预处理中属性分组的结果,使行人属性分别对应头部、躯干区域和腿部这三个分支,每一个分支只会预测与其对应的属性; 步骤4、通过损失计算训练网络模型; 在损失函数的设计上,使用联合损失函数;具体由分类损失和定位损失两个部分组合而成; 步骤4-1:现有的行人属性数据集存在比较严重的属性样本不平衡问题,使用加权的focalloss的函数解决上述的问题,分类损失计算公式如下: 其中am表示第m个属性的先验类别分布,wm表示第m个属性的损失权重,σ表示使用sigmoid激活函数,α、γ为设置的权重,yi表示行人图像对应的属性标签,表示行人图像对应的属性的预测结果; 步骤4-2:除了属性识别的分类的损失,零件定位模块也需要计算定位损失,来更准确的辅助身体部件的定位; 首先,提出的是中心约束,通过限定空间变化网络的先验中心点来解决空间变化网络的结果都容易落入同一区域的问题,约束的具体公式如下: 其中ty代表垂直方向的translate,Cy是每个部分的先验中心点对应的y坐标值;参数α′是控制估计中心点和先验中心点之间平移的阈值;Cy的值分别为0.6、0和-0.5;设置阈值α′的值为1.25; 对仿射变换矩阵中scale的参数值的范围提出约束,来解决scale参数结果容易出现负数的问题,导致图像水平和垂直翻转的问题,约束的具体公式如下: 其中sx代表水平方向的scale,sy代表垂直方向的scale;β是阈值参数,作为优选,设置阈值β的值为0.1; 对在图像内裁减的区域提出约束,来解决仿射变化得到的crop区域会出现在图像外部的问题,约束的具体公式如下: 其中参数γ代表边界阈值; 步骤4-3:联合损失; 定位损失函数由3部分组成中心约束Lcen,scale范围约束Lscale和crop区域约束Lin三部分组成;定位损失函数的具体描述如下: Lloc=Lcen+∈Lscale+μLin 其中∈和μ是超参数; 网络的总损失等于分类损失和定位损失加权之和,得到总损失函数描述如下: Lall=Lcls+ωLloc 其中ω是定位损失所占的权重参数; 步骤5、全局特征分支输出M个属性的预测结果,局部特征分支经过resnet50的conv1-4模块的特征提取,通过平均池化和全连接层输出三个分支的属性预测结果;头部、躯干和腿部三个分支会分别输出N1,N2,N3个属性的预测结果,N1,N2,N3代表输出属性的个数;根据属性分组可知,由于没有计算全局属性,因此头部、躯干和腿部三个分支的属性总和会小于总属性数M;对三个分支的属性预测结果进行Concat拼接处理,为了防止后续出现维度不匹配的问题,将拼接得到的输出扩展到1×M维,长度不足M的部分以默认0填充;最后,对两个输出结果采用逐元素取最大值方案,得到最后的属性预测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。