Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华中科技大学谢延昭获国家专利权

华中科技大学谢延昭获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华中科技大学申请的专利一种基于对象规模感知的多标签图像检索方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116127119B

龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310002357.2,技术领域涉及:G06F16/583;该发明授权一种基于对象规模感知的多标签图像检索方法和系统是由谢延昭;魏如凯;刘渝;周可设计研发完成,并于2023-01-03向国家知识产权局提交的专利申请。

一种基于对象规模感知的多标签图像检索方法和系统在说明书摘要公布了:本发明公开了一种基于对象规模感知的多标签图像检索方法,其利用感知图像对象规模的哈希质心,构建了一个具有较高检索性能的端到端多标签图像检索方法。本发明提出的方法首先利用SwinTransformer骨干网络作为图像特征提取器,用标签语义信息指导哈希中心点的生成,并提出与对象规模相关的标签亲和度系数的计算方法,二者共同生成包含了对象规模的哈希质心。这些哈希质心作为汉明空间中的锚点,引导多标签图像哈希码不断靠近其对应哈希质心,通过不断的优化基于中心相似性损失函数,使得模型学习到良好的哈希映射关系。本发明使用的哈希质心包含了图像中不同对象的规模信息,结合SwinTransformer骨干网络的强大特征提取能能力,大大提高了图像检索方法的检索性能。

本发明授权一种基于对象规模感知的多标签图像检索方法和系统在权利要求书中公布了:1.一种基于对象规模感知的多标签图像检索方法,其特征在于,包括以下步骤: (1)获取待检索图像以及图像数据库中的多个图像样本,使用PIL库将该待检索图像和每个图像样本分别转换为多维张量,所有多维张量构成多维张量集合; (2)将步骤(1)得到的多维张量集合输入预先训练好的检索模型中,以得到待检索图像对应的哈希码,以及每个图像样本对应的哈希码;检索模型包括依次连接的SwinTransformer网络、哈希映射层和哈希中心生成网络; SwinTransformer网络接收输入维度为的张量,输出维度为的矩阵,为训练过程中设置的批量数据大小; 哈希映射层由三层全连接层连接而成;第一层的输入为SwinTransformer网络输出的维度为矩阵,该层使用维权重矩阵,该层的输出为维矩阵;第二层的输入为第一层输出的维矩阵,该层使用维权重矩阵,输出为维矩阵;第三层的输入为第二层输出的维矩阵,该层使用维权重矩阵,输出为维矩阵;其中,表示哈希码长度; 哈希中心生成网络包含3个堆叠而成的全连接层;第一层输入为维标签词向量矩阵,该层使用维权重矩阵,该层输出为维矩阵;第二层输入为第一层输出的维矩阵,使用维权重矩阵,该层输出为维哈希中心点矩阵;第三层输入为第二层输出的维矩阵,使用维权重矩阵,该层输出为维哈希中心点矩阵,其中K表示哈希码位长,且有,表示图像数据库中包含的所有标签类别个数,表示每个标签词向量的维度; (3)针对步骤(2)得到的每个图像样本对应的哈希码而言,计算其与步骤(2)得到的待检索图像对应的哈希码之间的相似度,根据得到的多个相似度计算结果选择与待检索图像匹配的多个图像样本输出。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号华中科技大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。