启元实验室;中国人民解放军海军工程大学李频捷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉启元实验室;中国人民解放军海军工程大学申请的专利开集细粒度的识别方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119851020B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411919061.8,技术领域涉及:G06V10/764;该发明授权开集细粒度的识别方法和装置是由李频捷;吴静;刘晓言;张涛;赵千川;张清怡;王子旋设计研发完成,并于2024-12-24向国家知识产权局提交的专利申请。
本开集细粒度的识别方法和装置在说明书摘要公布了:本申请提供一种开集细粒度的识别方法和装置,涉及图像识别技术领域。方法包括:基于细粒度识别数据集训练得到多模态特征提取模型,在训练过程中,视觉特征样本和文本特征样本对齐后进行对比学习;将待识别图像数据输入至预设视觉特征提取网络,得到待识别图像特征;将待识别图像特征和预设细粒度视觉特征查询条件输入至预设Transformer模型,得到待识别细粒度视觉特征;将类别文本描述输入至预设自然语言特征提取模型,得到待识别文本特征;将待识别细粒度视觉特征和待识别文本特征输入至多模态特征提取模型,进行特征对齐得到融合特征;将融合特征输入至开集细粒度分类模型,得到目标细粒度类别,从而实现开集识别且准确率高。
本发明授权开集细粒度的识别方法和装置在权利要求书中公布了:1.一种开集细粒度的识别方法,其特征在于,包括: 构建细粒度识别数据集;其中,所述细粒度识别数据集包括带有文本标签的多组图像数据样本; 基于所述细粒度识别数据集,训练得到多模态特征提取模型; 将待识别图像数据输入至预设视觉特征提取网络,得到待识别图像特征; 将所述待识别图像特征和预设细粒度视觉特征查询条件输入至预设Transformer模型,得到待识别细粒度视觉特征; 将所述待识别图像数据的类别文本描述输入至预设自然语言特征提取模型,得到待识别文本特征,其中,所述类别文本描述为待识别图像的描述; 将所述待识别细粒度视觉特征和所述待识别文本特征输入至所述多模态特征提取模型,基于所述多模态特征提取模型进行模态对齐,并融合模态对齐后的所述待识别细粒度视觉特征和所述待识别文本特征,得到融合特征; 将所述融合特征输入至预先训练的开集细粒度分类模型,得到所述待识别图像数据的目标细粒度类别,其中,所述开集细粒度分类模型用于根据所述融合特征与预设类别语言特征的特征距离,利用预设特征距离阈值确定所述目标细粒度类别,所述目标细粒度类别为所述预设类别语言特征对应的类别中的一种或未知类别; 其中,将所述融合特征输入至预先训练的开集细粒度分类模型,得到所述待识别图像数据的目标细粒度类别,包括: 利用所述开集细粒度分类模型,计算所述融合特征与所有所述预设类别语言特征的特征距离; 在所有所述特征距离均大于预设特征距离阈值的情况下,确定所述目标细粒度类别为未知类别; 在所有所述特征距离中存在不大于所述预设特征距离阈值的特征距离的情况下,确定所述目标细粒度类别为第一类别;其中,所述第一类别为所有所述特征距离中最小的特征距离对应的预设类别语言特征的类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人启元实验室;中国人民解放军海军工程大学,其通讯地址为:100084 北京市海淀区紫雀路55号院8号楼-1至6层101;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励