汉王科技股份有限公司;北京科技大学殷绪成获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉汉王科技股份有限公司;北京科技大学申请的专利复杂图文检测提取方法、装置、电子设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121459334B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610007158.4,技术领域涉及:G06V20/62;该发明授权复杂图文检测提取方法、装置、电子设备和存储介质是由殷绪成;张曦允;祝晓斌;杨春;黄磊;刘正珍;彭菲设计研发完成,并于2026-01-05向国家知识产权局提交的专利申请。
本复杂图文检测提取方法、装置、电子设备和存储介质在说明书摘要公布了:本申请实施例提供了一种复杂图文检测提取方法、装置、电子设备和存储介质。所述方法包括:对目标文本图像进行基于查询的字符级检测,获取字符级别的掩码、类别预测结果和更新后的查询向量;基于掩码、类别预测结果和查询向量,获取各字符的多模态嵌入向量,多模态嵌入向量包括:位置嵌入向量、语义嵌入向量和视觉嵌入向量;以位置嵌入向量作为位置约束,以视觉嵌入向量作为视觉约束,构建各字符的局部子图;联合语义嵌入向量,基于局部子图推理字符的连接关系;基于各字符的连接关系,得到目标文本图像的文本检测结果。本方法可以有效解决重叠、粘连,混排等场景的错误分割问题,有效提升了文本检测准确度和精度。
本发明授权复杂图文检测提取方法、装置、电子设备和存储介质在权利要求书中公布了:1.一种复杂图文检测提取方法,其特征在于,所述方法包括: 对目标文本图像进行基于查询的字符级检测,获取字符级别的掩码、类别预测结果和更新后的查询向量; 基于所述掩码、所述类别预测结果和所述查询向量,获取各字符的多模态嵌入向量,所述多模态嵌入向量包括:位置嵌入向量、语义嵌入向量和视觉嵌入向量; 以所述位置嵌入向量作为位置约束,以所述视觉嵌入向量作为视觉约束,构建各所述字符的局部子图; 联合所述语义嵌入向量,基于所述局部子图推理所述字符的连接关系; 基于各所述字符的所述连接关系,得到所述目标文本图像的文本检测结果;其中,所述联合所述语义嵌入向量,基于所述局部子图推理所述字符的连接关系,包括: 基于所述局部子图获取当前字符对应的字符节点的邻居节点,得到所述当前字符的由相应所述字符节点和所述邻居节点构成的多个邻居节点对; 基于各所述邻居节点对中字符节点对应字符的所述位置嵌入向量、所述视觉嵌入向量和所述语义嵌入向量,得到所述当前字符的邻接消息; 将所述邻接消息和所述当前字符的所述位置嵌入向量和所述视觉嵌入向量进行融合,作为图神经网络的输入,通过所述图神经网络对所述输入进行多层消息传递和更新处理,得到所述当前字符与所述局部子图中其他字符的连接关系,其中,在更新处理时,所述语义嵌入向量作为静态附加信息参与消息计算,其数值在多层消息传递过程中保持不更新,所述位置嵌入向量和所述视觉嵌入向量作为动态更新信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人汉王科技股份有限公司;北京科技大学,其通讯地址为:100193 北京市海淀区东北旺西路8号5号楼三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励