中国人民解放军国防科技大学胡越获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利基于双重知识蒸馏的视觉定位方法、装置、设备和存储器获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116778140B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310790208.7,技术领域涉及:G06V10/22;该发明授权基于双重知识蒸馏的视觉定位方法、装置、设备和存储器是由胡越;武万森;秦龙;许凯;张淼;祝建成;尹全军;刘婷;王有凯设计研发完成,并于2023-06-29向国家知识产权局提交的专利申请。
本基于双重知识蒸馏的视觉定位方法、装置、设备和存储器在说明书摘要公布了:本申请涉及一种基于双重知识蒸馏的视觉定位方法、装置、设备和存储器。该方法包括:将获取的原始图像和对应的语言查询作为训练样本;构建基于双重知识蒸馏的视觉定位模型;该模型包括学生网络、语义知识蒸馏模块和定位知识蒸馏模块;语义知识蒸馏模用于采用教师网络将训练样本编码为视觉特征和语义特征,将视觉特征和语义特征蒸馏到学生网络;定位知识蒸馏模块用于采用对比学习方式学习定位知识;根据训练样本和总损失函数对多视觉定位模型进行训练,将待测图像和对应的语言查询输入到训练好的视觉定位模型的学生网络中,得到定位边界框。该方法提高了基础架构的跨模态表示,并使两种模态之间的相关性更加紧密,采用该方法可提高视觉定位精度。
本发明授权基于双重知识蒸馏的视觉定位方法、装置、设备和存储器在权利要求书中公布了:1.一种基于双重知识蒸馏的视觉定位方法,其特征在于,所述方法包括: 将获取的原始图像和对应的语言查询作为训练样本; 构建基于双重知识蒸馏的视觉定位模型;所述视觉定位模型包括学生网络、语义知识蒸馏模块和定位知识蒸馏模块;所述语义知识蒸馏模用于采用教师网络将所述训练样本编码为视觉特征和语义特征,将所述视觉特征和所述语义特征从教师网络蒸馏到所述学生网络;所述学生网络用于将所述训练样本进行编码,并根据编码结果和蒸馏所述视觉特征和所述语义特征的进行融合,根据得到的融合特征进行预测,得到预测定位边界框;所述定位知识蒸馏模块用于根据所述预测定位边界框的原始图像或特征向量采用语义定位感知采样机制生成高质量的正负样本,并采用对比学习方式学习定位知识; 构建所述视觉定位模型的总损失函数; 根据所述训练样本和所述总损失函数对所述视觉定位模型进行训练,得到训练好的视觉定位模型; 将待测图像和对应的语言查询输入到训练好的视觉定位模型的学生网络中,得到定位边界框。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。