华中科技大学李国徽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学申请的专利一种图像识别系统及其训练方法、图像识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119810838B 。
龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411869689.1,技术领域涉及:G06V20/70;该发明授权一种图像识别系统及其训练方法、图像识别方法是由李国徽;袁凌;赵晓童;潘鹏设计研发完成,并于2024-12-18向国家知识产权局提交的专利申请。
本一种图像识别系统及其训练方法、图像识别方法在说明书摘要公布了:本发明属于图像识别相关技术领域,其公开了一种图像识别系统及其训练方法、图像识别方法,该系统中:粗粒度场景感知模块识别出与输入图像最相关的场景;细粒度目标感知模块基于粗粒度场景感知模块所提供的信息计算各特征点与最相关场景下各目标的相似度得分;编码模块具有多分支自注意力计算单元,多分支注意力计算单元基于相似度得分将显著性特征点加入同一个自注意力分支,形成多分支自注意力图像编码,着重对所加入的显著性特征进行编码计算;解码模块对编码特征进行解码,识别输入图像中的目标。通过以上系统,可以降低编码器的计算复杂度,提高重点目标的特征提取能力,减少不同类别目标和图像背景区域的干扰,加快图像处理速度。
本发明授权一种图像识别系统及其训练方法、图像识别方法在权利要求书中公布了:1.一种图像识别系统,其特征在于,包括: 特征提取模块,用于提取输入图像的特征,得到各特征点的特征向量; 粗粒度场景感知模块,包括场景语义生成单元和第一相似度计算单元,所述场景语义生成单元用于生成预设场景集合中各类场景的场景语义向量,所述第一相似度计算单元用于对所有特征向量进行池化得到全局特征后选出与相似度最高的场景及其场景语义向量; 细粒度目标感知模块,包括融合单元、目标语义生成单元和第二相似度计算单元,所述融合单元用于将场景所包含的各类目标的目标文本嵌入与向量拼接得到各类目标的联合嵌入表示,所述目标语义生成单元用于将各所述联合嵌入表示映射为目标语义向量,所述第二相似度计算单元用于通过计算向量的相似度得到各特征点与各类目标的相似度得分; Transformer编码模块,用于对所有特征向量进行编码,得到编码特征,所述Transformer编码模块具有多分支自注意力计算单元,所述多分支注意力计算单元用于搜索存在相似度得分超过阈值的特征点作为显著性特征点,针对每个显著性特征点,搜索与其相似度得分最高的预设数量的目标作为候选目标,将对应同一个候选目标的所有显著性特征点加入同一个自注意力分支,使所有自注意力分支分别执行自注意力计算; Transformer解码模块,用于对所述编码特征进行解码,识别所述输入图像中的目标; 所述Transformer解码模块从所述Transformer编码模块的输出结果中获取一系列先验特征点并构建每个先验特征点对应的内容查询向量和位置查询向量,基于内容查询向量解码目标类别,基于位置查询向量解码目标位置; 针对每个先验特征点,其内容查询向量由该先验特征点的可训练查询向量和融合语义向量进行拼接而成,所述融合语义向量为与该先验特征点的编码特征相似度得分最高的预设数量的目标语义向量进行加权求和所得,每个目标语义向量的权重正相关于该目标语义向量与该先验特征点编码特征的相似度; 所述场景语义生成单元和所述目标语义生成单元均为可训练的多层感知机; 所述粗粒度场景感知模块还包括场景类别文本嵌入层,用于将各类场景的语言描述转换为场景文本嵌入后发送给所述场景语义生成单元,得到各类场景的所述场景语义向量; 所述细粒度目标感知模块还包括目标类别文本嵌入层,用于将各类目标的语言描述转换为目标文本嵌入后发送给所述融合单元进行拼接得到各类目标的所述联合嵌入表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励