西藏民族大学王菽裕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西藏民族大学申请的专利基于VSSM和掩码重建的多尺度人群计数方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120673349B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511184315.0,技术领域涉及:G06V20/52;该发明授权基于VSSM和掩码重建的多尺度人群计数方法、系统及介质是由王菽裕;刘明军;王子珩;胡韵设计研发完成,并于2025-08-22向国家知识产权局提交的专利申请。
本基于VSSM和掩码重建的多尺度人群计数方法、系统及介质在说明书摘要公布了:本发明公开了一种基于VSSM和掩码重建的多尺度人群计数方法、系统及介质,属于计算机视觉与深度学习领域,本发明对输入人群图像进行多尺度变换和分割操作,以得到每个尺度下的图像块;对每个图像块进行分析,得到信息熵图,并根据信息熵图对每个图像块进行掩码操作,将掩码图像块输入VSSM中进行特征提取,以得到编码特征,通过Transformer解码器对编码特征进行解码重建,最终得到重构特征图像;采用多尺度融合模块融合不同尺度的重构特征图像,生成融合特征;基于融合特征生成人群密度图,并通过对人群密度图进行分析得到人群计数结果。避免了单一尺度分析导致的计数误差,显著提升了全尺度范围内的人群计数精度。
本发明授权基于VSSM和掩码重建的多尺度人群计数方法、系统及介质在权利要求书中公布了:1.一种基于VSSM和掩码重建的多尺度人群计数方法,其特征在于,具体步骤包括: 步骤1:对输入人群图像进行标准化和多尺度变换,以得到不同尺度的缩放输入人群图像后,执行分割操作,以得到每个尺度下的图像块集合; 步骤2:对图像块集合中的每个图像块进行分析,得到反映每个图像块密度复杂情况的信息熵图,并根据信息熵图对每个图像块进行掩码操作,得到掩码图像块集合; 步骤3:将掩码图像块输入VSSM中进行特征提取,得到每一尺度下的编码特征,所述VSSM通过2D选择性扫描机制建立全局感受野,生成具有长程依赖关系的编码特征; 步骤4:通过Transformer解码器对所述编码特征进行解码重建,生成重建块,并计算用于自监督预训练的联合损失,基于各尺度的重构块生成对应的重构特征图像; 步骤5:采用基于注意力机制的多尺度融合模块,对不同尺度的重构特征图像进行融合,生成融合特征; 步骤6:基于融合特征生成人群密度图,并通过对人群密度图进行分析得到人群计数结果; 将图像块划分成个等尺寸的区域,计算每块区域的信息熵,构成信息熵图,并计算每块区域与其邻接区域的平均信息熵的差值,将这个差值称为信息落差,按照信息熵从大到小的顺序对划分的区域进行排序,得到信息熵排列序列,按照信息落差从小到大的顺序对划分的区域进行排序得到信息落差排列序列,将信息熵排列序列的前个区域构成信息熵区域集合,将信息落差排列序列的前个区域构成信息落差区域集合; 设置步长为1,从开始进行迭代,当满足信息熵集合和信息落差集合的交集区域大于图像块总区域的20%时,从信息熵集合和信息落差集合的交集中随机选取个区域,构成熵落集合,执行随机选取操作10次,为向上取整操作,为信息熵集合和信息落差集合的交集中的区域数; 对于每个熵落集合,计算每块区域中心坐标与图像块中心坐标之间的距离,并计算所有距离的标准差,预设标准差阈值,将距离的标准差与标准差阈值进行比较; 若10次随机选取操作中,存在距离的标准差大于标准差阈值的熵落集合,则终止迭代,随机选择一个熵落集合,对熵落集合中的区域执行完全掩码操作;若10次随机选取操作中,都不存在距离的标准差大于标准差阈值的熵落集合,则进行下一次迭代,直至终止迭代。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西藏民族大学,其通讯地址为:712082 陕西省咸阳市渭城区文汇东路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励