北京有竹居网络技术有限公司江毅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京有竹居网络技术有限公司申请的专利图像分类方法、装置、可读介质和电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114511744B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210112946.1,技术领域涉及:G06V10/764;该发明授权图像分类方法、装置、可读介质和电子设备是由江毅;刁其帅;文彬;孙佳;袁泽寰;赵修影设计研发完成,并于2022-01-29向国家知识产权局提交的专利申请。
本图像分类方法、装置、可读介质和电子设备在说明书摘要公布了:本公开涉及一种图像分类方法、装置、可读介质和电子设备,该方法可以包括:获取待分类图像和待分类图像的多模态信息,多模态信息包括文本信息、时空信息和属性信息,根据待分类图像和所述多模态信息,通过预先训练好的图像分类模型,确定待分类图像的图像分类结果,其中,图像分类模型用于获取待分类图像对应的图像编码向量和多模态信息对应的多模态编码向量,并对图像编码向量和多模态编码向量进行融合,得到目标分类向量,并根据目标分类向量,确定图像分类结果。本公开通过图像分类模型在待分类图像的基础上,结合了多模态信息来进行图像分类,能够准确地完成细粒度图像分类任务,确保图像分类结果的准确性。
本发明授权图像分类方法、装置、可读介质和电子设备在权利要求书中公布了:1.一种图像分类方法,其特征在于,所述方法包括: 获取待分类图像和所述待分类图像的多模态信息;所述多模态信息包括文本信息、时空信息和属性信息; 根据所述待分类图像和所述多模态信息,通过预先训练好的图像分类模型,确定所述待分类图像的图像分类结果; 其中,所述图像分类模型用于获取所述待分类图像对应的图像编码向量和所述多模态信息对应的多模态编码向量,并对所述图像编码向量和所述多模态编码向量进行融合,得到目标分类向量,并根据所述目标分类向量,确定所述图像分类结果; 所述图像分类模型包括图像编码模块、多模态信息编码模块、信息融合模块和分类器;所述根据所述待分类图像和所述多模态信息,通过预先训练好的图像分类模型,确定所述待分类图像的图像分类结果,包括: 通过所述图像编码模块对所述待分类图像进行编码,得到所述图像编码向量; 通过所述多模态信息编码模块获取所述多模态信息对应的多模态特征向量,并对所述多模态特征向量进行编码,得到所述多模态编码向量; 通过所述信息融合模块对所述图像编码向量和所述多模态编码向量进行融合,得到所述目标分类向量; 通过所述分类器根据所述目标分类向量,确定所述图像分类结果; 所述通过所述信息融合模块对所述图像编码向量和所述多模态编码向量进行融合,得到所述目标分类向量,包括: 通过所述信息融合模块对所述图像编码向量、所述多模态编码向量和预设编码向量进行融合,得到融合向量,并根据所述融合向量,确定所述目标分类向量; 所述预设编码向量包括第一预设编码向量和第二预设编码向量,所述融合向量包括第一融合向量和第二融合向量;所述通过所述信息融合模块对所述图像编码向量、所述多模态编码向量和预设编码向量进行融合,得到融合向量,并根据所述融合向量,确定所述目标分类向量,包括: 通过所述信息融合模块对所述图像编码向量进行降采样,得到第一图像编码向量,并对所述第一图像编码向量、所述多模态编码向量和所述第一预设编码向量进行融合,得到所述第一融合向量; 通过所述信息融合模块对所述第一图像编码向量进行降采样,得到第二图像编码向量,并对所述第二图像编码向量、所述多模态编码向量和所述第二预设编码向量进行融合,得到所述第二融合向量; 根据所述第一融合向量和所述第二融合向量,确定所述目标分类向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京有竹居网络技术有限公司,其通讯地址为:101299 北京市平谷区林荫北街13号信息大厦802室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励