哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)徐睿峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种图像的文本描述信息生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117037177B 。
龙图腾网通过国家知识产权局官网在2025-12-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310978020.5,技术领域涉及:G06V30/18;该发明授权一种图像的文本描述信息生成方法是由徐睿峰;王冰冰;梁斌;巫继鹏;杨敏设计研发完成,并于2023-08-03向国家知识产权局提交的专利申请。
本一种图像的文本描述信息生成方法在说明书摘要公布了:本申请公开了一种图像的文本描述信息生成方法,该图像的文本描述信息生成方法包括获取目标图像的图像特征、目标图像中目标物体的物体特征以及目标图像中目标区域的区域特征,目标区域基于目标图像中的目标物体确定;基于自适应注意机制对目标图像的图像特征进行处理,得到目标图像的全局表示;对目标物体的物体特征以及目标区域的区域特征进行局部感知处理,得到目标图像的局部表示;基于全局表示和局部表示进行解码处理,得到目标图像的目标文本描述信息。上述方案,能够提高文本描述信息生成的准确性。
本发明授权一种图像的文本描述信息生成方法在权利要求书中公布了:1.一种图像的文本描述信息生成方法,其特征在于,所述方法包括: 获取目标图像的图像特征、所述目标图像中目标物体的物体特征以及所述目标图像中目标区域的区域特征,所述目标区域基于所述目标图像中的目标物体确定; 基于自适应注意机制对所述目标图像的图像特征进行处理,得到所述目标图像的全局表示; 对所述目标物体的物体特征以及所述目标区域的区域特征进行局部感知处理,得到所述目标图像的局部表示; 基于所述全局表示和所述局部表示进行解码处理,得到所述目标图像的目标文本描述信息; 所述基于自适应注意机制对所述目标图像的图像特征进行处理,得到所述目标图像的全局表示的步骤,包括: 对所述目标图像的图像特征进行平均池化和最大池化处理,得到空间注意参数; 基于所述空间注意参数和获取的时间注意参数确定自适应注意参数,所述时间注意参数基于所述目标图像中各像素点的注视时间确定的; 基于所述自适应注意参数和所述目标图像的图像特征确定所述目标图像的全局表示; 所述对所述目标物体的物体特征以及所述目标区域的区域特征进行局部感知处理,得到所述目标图像的局部表示的步骤,包括: 对所述目标物体的物体特征和所述目标区域的区域特征进行拼接,得到所述目标图像中的顶点以及所述顶点的顶点特征; 计算所述目标图像中目标顶点对应的目标物体的物体特征与其它顶点对应的目标物体的物体特征之间的第一余弦相似度,所述其它顶点为以所述目标顶点为中心的预设范围内的顶点; 计算所述目标顶点对应的目标区域的区域特征与所述其它顶点对应的目标区域的区域特征之间的第二余弦相似度; 基于所述第一余弦相似度、所述第二余弦相似度、所述目标顶点的顶点特征以及所述其它顶点的顶点特征确定所述目标图像的局部表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励