浙江工业大学郑雅羽获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种针对三线表的表格结构识别的方法、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115439866B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210915421.1,技术领域涉及:G06V30/412;该发明授权一种针对三线表的表格结构识别的方法、设备和存储介质是由郑雅羽;张子涵;姚沈设计研发完成,并于2022-07-31向国家知识产权局提交的专利申请。
本一种针对三线表的表格结构识别的方法、设备和存储介质在说明书摘要公布了:本发明提出一种针对三线表的表格结构识别的方法、设备和存储介质,预处理图片,得到二值化图像,取反后进行水平腐蚀和水平膨胀,得到水平表格线图像;将二值化图像和水平表格线图像的像素逻辑或,得到无表格线图像,分别进行水平腐蚀和垂直腐蚀,并将结果合并,得到初始单元格掩膜;遍历水平表格线,再次分割单元格,得到最终单元格掩膜,计算并获取其中所有单元格的信息,得到代表三线表的表格结构;本发明提高对各种类型的三线表结构识别的准确率,有效减少单元格漏检、多检的问题,结果包含的信息完整、具体,有利于后续的表格结构还原等处理;采用非数据驱动的方法,无需大量数据,运算量小;可以更准确、通用地识别出三线表的表格结构。
本发明授权一种针对三线表的表格结构识别的方法、设备和存储介质在权利要求书中公布了:1.一种针对三线表的表格结构识别方法,其特征在于,包括如下步骤: S1:读取含三线表的待识别图片,进行预处理;所述三线表的水平表格线长度为等长或不等长; S2:将经过所述预处理的三线表图片转化为取反二值化图像; S3:对所述取反二值化图像进行形态学处理,得到水平表格线图像; S4:将所述二值化图像的像素和所述水平表格线图像的像素进行逻辑或操作,得到无表格线图像; S5:对所述无表格线图像分别进行水平腐蚀操作和垂直腐蚀操作,并将所述水平腐蚀操作和所述垂直腐蚀操作的结果合并,得到初始单元格掩膜; S6:包括: 步骤6.1:按顺序遍历所述水平表格线;如果所有水平表格线长度相等,则以所述初始单元格掩膜为最终单元格掩膜;如果出现比第一条水平表格线短的水平表格线,则对当前表格线上方和下方的水平长度范围内的单元格列数进行重新分割; 步骤6.2:以当前水平表格线的长度为宽,当前水平表格线与上一条水平表格线的距离为高,确定一个位于该水平表格线上方的待分割区域;以当前水平表格线的长度为宽,当前水平表格线与下一条水平表格线的距离为高,确定一个位于该水平表格线下方的待分割区域; 步骤6.3:对2个所述待分割区域分别进行水平投影和垂直投影;分别遍历水平和垂直投影列表,在投影值发生突变时,记录坐标,得到坐标集合cells_x和cells_y,其中,每两个相邻的坐标点为一段连续投影的起止点,若相邻两个连续投影间隔小于一定阈值,则删去邻接的两个坐标点; 步骤6.4:遍历集合cells_x和cells_y,得到所述待分割区域内所有单元格的坐标;更新待分割区域的单元格的掩膜; 步骤6.5:重复步骤6.1至步骤6.4直至遍历完所述水平表格线,得到所述最终单元格掩膜; S7:计算所述最终单元格掩膜中单元格行列序列信息、所占行列数信息以及单元格框坐标信息的集合,得到代表三线表的表格结构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励