中国科学院自动化研究所张煦尧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利一种多模态小样本图像分类方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119963889B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411967091.6,技术领域涉及:G06V10/764;该发明授权一种多模态小样本图像分类方法和装置是由张煦尧;向子维设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种多模态小样本图像分类方法和装置在说明书摘要公布了:本发明提供一种多模态小样本图像分类方法和装置,包括:获取预先建立的数据集;其中,数据集包括多个图像数据对,每个图像数据对包括一张图像和与该图像内容对应的类别名称;对数据集中的类别名称进行文本语义扩充,并基于扩充后的文本描述为每一图像生成对应的标注向量,得到多模态数据集;基于多模态数据集对预先建立的分类模型进行预训练,得到预训练分类模型;通过元学习策略训练预训练分类模型,得到图像分类模型;获取待分类的目标图像,将目标图像输入图像分类模型得到图像分类结果。本发明可充分利用长文本信息,不仅关注视觉特征的优化,还充分挖掘语义先验中的潜力,提升小样本图像分类的准确性,具有很大的应用前景。
本发明授权一种多模态小样本图像分类方法和装置在权利要求书中公布了:1.一种多模态小样本图像分类方法,其特征在于,包括: 获取预先建立的数据集;其中,所述数据集包括多个图像数据对,每个图像数据对包括一张图像和与该图像内容对应的类别名称; 对所述数据集中的类别名称进行文本语义扩充,并基于扩充后的文本描述为每一图像生成对应的标注向量,得到多模态数据集;图像对应的标注向量通过下述方式生成:从预设数据库中提取所述类别名称的定义信息,利用预先建立的大语言模型对所述定义信息进行文本语义扩充得到扩充后的文本描述;使用分词器分解所述扩充后的文本描述,得到子词标记序列;将所述子词标记序列中的每一子词标记映射到词汇表中的身份标识,得到分词结果;对所述分词结果转换为向量,并为向量中的每一子词分配子词权重,得到所述标注向量;所述子词权重通过下述方式确定:获取语料库中包含子词的文档数和语料库中的总文档数;根据所述包含子词的文档数和所述语料库中的总文档数确定逆文档频率;确定子词在语料库中每一文档中的词频;获取语料库中各文档的长度,根据语料库中各文档的长度确定语料库中的平均文档长度;对于语料库中的每一文档,根据所述逆文档频率、子词在所述文档中的词频、所述平均文档长度和所述语料库中的总文档数,确定子词在所述文档中的权重;根据子词在各文档中的权重,确定子词权重; 基于所述多模态数据集对预先建立的分类模型进行预训练,得到预训练分类模型; 通过元学习策略训练所述预训练分类模型,得到图像分类模型; 获取待分类的目标图像,将所述目标图像输入所述图像分类模型得到图像分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。