南方科技大学何志海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南方科技大学申请的专利一种多标签图像分类方法、装置、终端及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119672396B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411560229.0,技术领域涉及:G06V10/764;该发明授权一种多标签图像分类方法、装置、终端及存储介质是由何志海;贾纪源;唐雨顺;陈玮铭;张毅;欧阳健设计研发完成,并于2024-11-04向国家知识产权局提交的专利申请。
本一种多标签图像分类方法、装置、终端及存储介质在说明书摘要公布了:本发明公开了一种多标签图像分类方法、装置、终端及存储介质,所述方法通过获取待分类图像,根据所述待分类图像确定所述待分类图像对应的若干局部特征和全局特征;获取若干类别标签,根据各所述类别标签对应的初始文本嵌入和各所述局部特征确定若干目标文本嵌入;根据各所述初始文本嵌入、各所述目标文本嵌入以及所述全局特征确定图像分类结果。由于本发明根据图像的局部特征和初始文本嵌入重建目标文本嵌入,动态的确定图像局部区域与类标签的对应关系,能够有效捕捉对象的完整特征,解决了现有的多标签分类方法难以捕捉对象区域的完整特征,导致在处理训练过程中未见过的新标签时存在局限性,影响多标签分类的准确率和鲁棒性的问题。
本发明授权一种多标签图像分类方法、装置、终端及存储介质在权利要求书中公布了:1.一种多标签图像分类方法,其特征在于,所述方法包括: 获取待分类图像,根据所述待分类图像确定所述待分类图像对应的若干局部特征和全局特征; 获取若干类别标签,根据各所述类别标签对应的初始文本嵌入和各所述局部特征确定若干目标文本嵌入; 根据各所述初始文本嵌入、各所述目标文本嵌入以及所述全局特征确定图像分类结果; 所述根据所述待分类图像确定所述待分类图像对应的若干局部特征和全局特征,包括: 对所述待分类图像进行分割、线性映射以及位置编码,确定所述待分类图像对应的若干特征向量; 通过编码层对各所述特征向量进行学习,得到所述分类图像对应的所述局部特征和所述全局特征,其中,所述编码层包括N个编码块,每一所述编码块包括多头自注意力机制、归一化层以及多层感知器; 所述通过编码层对各所述特征向量进行学习,得到所述分类图像对应的所述局部特征和所述全局特征,包括: 将各所述特征向量输入所述编码层中进行学习,得到所述编码层中各所述编码块输出的编码块数据,其中,第1个所述编码块的输入数据为各所述特征向量,第i个所述编码块的输入数据为第i-1个所述编码块输出的编码块数据,0iN; 获取第N-1个所述编码块输出的编码块数据作为所述局部特征; 获取第N个所述编码块输出的编码块数据作为所述全局特征; 所述根据各所述类别标签对应的初始文本嵌入和各所述局部特征确定若干目标文本嵌入,包括: 计算各所述初始文本嵌入和各所述局部特征的第一余弦相似度; 根据各所述第一余弦相似度和各所述局部特征确定若干目标文本嵌入。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南方科技大学,其通讯地址为:518055 广东省深圳市南山区桃源街道学苑大道1088号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励