江苏科技大学王东升获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏科技大学申请的专利一种基于目标检测和知识增强的图像描述生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115631331B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211258002.1,技术领域涉及:G06V10/25;该发明授权一种基于目标检测和知识增强的图像描述生成方法是由王东升;钟家国;冯越;刘莎;周淼淼;路曼设计研发完成,并于2022-10-13向国家知识产权局提交的专利申请。
本一种基于目标检测和知识增强的图像描述生成方法在说明书摘要公布了:本发明公开了基于目标检测和知识增强的图像描述生成方法,将目标检测阶段的区域框和类别标签联合起来,利用先进的人脸识别、商品识别等工具做更深层次的信息发掘,从而得到细粒度的背景知识;在解码阶段引入LBPF注意力机制,增强了词与词之间的联系,从而生成富含背景知识的、连贯的细粒度描述,为融入知识图谱的图像描述生成提供新思路。本发明与传统引入知识图谱方式相比,可以生成具有细粒度背景知识的描述,且具备细粒度实体间的关系;所描述的目标更加具体、描述的内容更为丰富,可读性更高。
本发明授权一种基于目标检测和知识增强的图像描述生成方法在权利要求书中公布了:1.一种基于目标检测和知识增强的图像描述生成方法,其特征在于,包括如下步骤: 步骤1:获取已有描述标注的图像描述数据集,对数据集中标题文本中的每个词进行识别,获取固定长度的词向量并组成相对应的词汇表;通过抽取图像感兴趣区域特征向量,识别图像实体区域框及图像实体类别,来获取固定长度的类别特征词向量;对图像进行识别,获取固定长度的图像实体特征向量;检测图像,获得图像中所含的目标区域框和目标标签; 步骤2:将目标标签、目标区域框作为分类检测方法的输入,分类检测方法先根据目标标签,使用人脸识别方法及通用商品识别方法将目标标签与目标区域框进行匹配,获得区域内的目标特征标签集;分类检测方法再在匹配完成的基础上根据目标区域框,使用人脸识别方法及通用商品识别方法获得目标具体的信息,即人脸特征标签,物体特征标签; 步骤3:将目标标签、人脸特征标签、物体特征标签,通过知识图谱术语检索方法,获得图像中目标的背景信息标签集; 步骤4:将目标特征标签集和背景信息标签集分别作为深度学习RNN网络的输入,获取目标特征向量、背景信息特征向量; 或将目标特征标签集和背景信息标签集分别作为深度学习RNN网络的输入,得到深度学习RNN网络中产生图像特征,根据图像实体特征向量、背景信息特征向量、深度学习RNN网络中产生图像特征,得到图像的融合特征向量; 步骤5:将目标特征向量、背景信息特征向量作为长短期记忆网络的输入量,类别特征词向量作为长短期记忆网络的输出量,实现长短期记忆网络的训练; 或将融合特征向量作为长短期记忆网络的输入量类别特征词向量作为长短期记忆网络的输出量,实现长短期记忆网络的训练; 步骤6:用训练好的长短期记忆网络生成图像描述内容。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏科技大学,其通讯地址为:212100 江苏省镇江市丹徒区长晖路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励