昆明理工大学刘英莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于级联解码的表格结构识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116543403B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310389028.8,技术领域涉及:G06V30/412;该发明授权一种基于级联解码的表格结构识别方法是由刘英莉;张广涛;郑剑锋;沈韬设计研发完成,并于2023-04-12向国家知识产权局提交的专利申请。
本一种基于级联解码的表格结构识别方法在说明书摘要公布了:本发明涉及一种基于级联解码的表格结构识别方法,属于半结构化文本生成技术领域。首先将表格图像输入到编码器进行编码,用以捕获所输入表格图像的视觉特征;然后将编码结果分别输入到行解码器和单元格解码器中;其中,首先将编码结果单独输入到行解码器解码得到表头、表体、行等标记;再将编码结果与行解码器解码结果输入单元格解码器解码得到单元格标记以及单元格行列跨度属性;最后将两种解码器解码结果融合得到相应表格图像的结构化HTML序列表示。本发明将编码结果分别在行、单元格两个层面上进行解码,分级解码结构保证每个解码器不会生成较长的HTML序列,解决了生成较长序列时的错误累计问题,能够更准确的识别表格结构信息。
本发明授权一种基于级联解码的表格结构识别方法在权利要求书中公布了:1.一种基于级联解码的表格结构识别方法,其特征在于: Step1:利用编码器从表格图像中提取视觉特征; Step2:对编码器提取的视觉特征,单独输入行解码器进行解码,行解码器的训练过程如下: 训练数据:对公开数据集注释文件进行处理,只保留表头标签、表体标签、行标签; 训练模型及模型推理:在模型训练过程中,使用融合注意力机制的循环单元模块从编码器提取的视觉特征中学习表格行特征,在推理过程中只生成表头标签、标题标签和行标签; Step3:对行解码器解码结果,与编码器提取的视觉特征一同输入单元格解码器,以对每一行中所有单元格对应的单元格标签和单元格属性进行解码; 训练模型:在模型训练过程中,使用融合注意力机制的循环单元模块从编码器所提取的视觉特征和行解码器隐藏层特征中学习单元格特征; 模型推理:在模型推理过程中,根据行解码器解码结果决定单元格解码器是否生成单元格标签、单元格行列跨度属性; Step4:融合行解码器解码结果和单元格解码器解码结果以得到该表格图像对应的完整HTML序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650093 云南省昆明市五华区学府路253号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。