北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司刘志远获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司申请的专利一种图像语义理解方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114429566B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210067262.4,技术领域涉及:G06V10/764;该发明授权一种图像语义理解方法、装置、设备及存储介质是由刘志远;赵建博;刘涵宇;马伟;谢奇奇;刘超;刘朋樟;包勇军设计研发完成,并于2022-01-20向国家知识产权局提交的专利申请。
本一种图像语义理解方法、装置、设备及存储介质在说明书摘要公布了:本发明实施例公开了一种图像语义理解方法、装置、设备和存储介质,所述方法包括:获取目标图像信息;将所述目标图像信息输入至预先训练的语义理解模型中,获得所述语义理解模型输出的语义分类结果,所述语义理解模型基于关联的图像信息和文本信息训练得到;根据所述语义分类结果确定语义理解结果。本发明实施例提供的方法通过直接基于获取的关联的图像信息和文本信息训练得到的语义理解模型对目标图像信息进行分类,简化了模型训练时的标注量,实现了少了标注即可训练得到分类准确的语义理解模型。
本发明授权一种图像语义理解方法、装置、设备及存储介质在权利要求书中公布了:1.一种图像语义理解方法,其特征在于,包括: 获取目标图像信息; 将所述目标图像信息输入至预先训练的语义理解模型中,获得所述语义理解模型输出的语义分类结果,所述语义理解模型基于关联的图像信息和文本信息训练得到; 根据所述语义分类结果确定语义理解结果; 所述语义理解模型包括图像编码子模型和语义分类子模型,所述将所述目标图像信息输入至预先训练的语义理解模型中,获得所述语义理解模型输出的语义分类结果,包括: 将所述目标图像信息输入至所述图像编码子模型中,得到所述图像编码子模型输出的目标图像语义向量; 将所述目标图像语义向量输入至所述语义分类子模型中,得到所述语义分类子模型输出的语义分类结果; 所述语义理解模型的训练包括: 基于评价信息中相关联的图文信息生成正样本数据和负样本数据,根据所述正样本数据和所述负样本数据生成训练样本数据; 基于所述训练样本数据,对预先构建的语义理解模型进行训练,得到训练后的语义理解模型; 所述图像编码子模型包括文本编码器和图像编码器,所述基于所述训练样本数据,对预先构建的语义理解模型进行训练,得到训练后的语义理解模型,包括: 针对所述训练样本数据中的图文信息对,将所述图文信息对的样本文本信息输入至所述文本编码器中,获得所述文本编码器输出的目标文本编码信息,将所述图文信息对的样本图像信息输入至所述图像编码器中,获得所述图像编码器输出的目标图像编码信息; 基于所述目标文本编码信息和所述目标图像编码信息确定目标损失值,以所述目标损失值达到收敛条件为目标,对所述图像编码子模型进行训练,得到训练后的图像编码子模型; 基于训练后的图像编码子模型对所述语义分类子模型进行训练,得到训练后的语义分类子模型; 所述文本编码器和所述图像编码器分别与所述语义分类子模型相连接,所述基于训练后的图像编码子模型对所述语义分类子模型进行训练,得到训练后的语义分类子模型,包括: 针对所述训练样本数据中的文本信息,基于所述文本编码器确定所述文本信息的文本编码信息; 根据所述文本编码信息和所述文本信息的标签构建语义分类模型训练样本; 基于所述语义分类模型训练样本,对预先构建的语义分类子模型进行训练,得到训练后的语义分类子模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,其通讯地址为:100176 北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。