Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳爱莫科技有限公司杨恒获国家专利权

深圳爱莫科技有限公司杨恒获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳爱莫科技有限公司申请的专利文档内容识别的结构信息优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120412002B

龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510918198.X,技术领域涉及:G06V30/414;该发明授权文档内容识别的结构信息优化方法是由杨恒;龙涛;谢青芯设计研发完成,并于2025-07-03向国家知识产权局提交的专利申请。

文档内容识别的结构信息优化方法在说明书摘要公布了:本发明提供了文档内容识别的结构信息优化方法,包括以下步骤:步骤一、获取专卖许可证的图片,基于深度学习模型提取图片中所有文字区域的文本框及其坐标与内容。本发明通过K‑Means空间聚类算法对文本框坐标动态聚类,配合列平移与滚动机制,解决了印刷设备误差等导致的文字错位问题,确保信息提取时字段与值的准确对应;借助PaddleOCR定制训练提升文本检测精度,结合Sentence‑BERT构建语义匹配模型及语义连贯性校验,解决了印刷缺失等导致的信息缺失问题,保障了信息管理及监管的准确性与效率;通过摒弃传统固定位置方法,采用动态聚类与排序、语义+空间双重匹配,适应不同版式和错位场景,解决了现有技术难以处理印刷错位的问题。

本发明授权文档内容识别的结构信息优化方法在权利要求书中公布了:1.文档内容识别的结构信息优化方法,其特征在于,包括以下步骤: 获取专卖许可证的图片,基于深度学习模型提取图片中所有文字区域的文本框及其坐标与内容; 对提取的所有文本框进行处理,删除属于许可证名称的文本框,并利用K-Means空间聚类算法,根据剩余文本框的坐标将其分配到左列和右列; 基于聚类后的每列文本框,根据其y值对文本框从上到下进行排序,获得两列有序排列的文本框及其文字内容; 在获得的每列内部,对相邻文本框的垂直距离进行判断,若两者y轴间距低于设定阈值,则将其文字内容合并为同一字段的连续部分; 基于Sentence-BERT,从现场采集的许可证图片中提取字段对,构建语义匹配数据集,训练获得语义匹配模型; 将左右列作为字段名与值的配对组,计算字段名与候选值的语义相似度,选择最高者为初始匹配; 若相似度超过阈值,以匹配行为锚点平移第二列,对齐匹配起点; 逐行匹配后续字段,若连续失败则滚动第二列重新匹配,输出成功匹配的字段对。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳爱莫科技有限公司,其通讯地址为:518000 广东省深圳市南山区西丽街道西丽社区打石一路深圳国际创新谷2栋A座2304;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。