Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 陆泽科技有限公司杨玉麟获国家专利权

陆泽科技有限公司杨玉麟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉陆泽科技有限公司申请的专利一种非结构化PDF文档智能解析方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120747992B

龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511248022.4,技术领域涉及:G06V30/413;该发明授权一种非结构化PDF文档智能解析方法、装置、设备及介质是由杨玉麟;杨守威;刘向东设计研发完成,并于2025-09-03向国家知识产权局提交的专利申请。

一种非结构化PDF文档智能解析方法、装置、设备及介质在说明书摘要公布了:本申请公开了一种非结构化PDF文档智能解析方法、装置、设备及介质,涉及文档解析领域,该方法包括:获取待解析的PDF文档,并解析PDF文档中的页面元素,生成文档元数据字典;若PDF文档中未包含可提取文本,则将PDF文档转换为图像并进行光学字符识别,生成第一结构化数据;若PDF文档中包含可提取文本,则判断PDF文档中是否包含表格;若PDF文档中不包含表格,则采用PDFMiner提取文本,生成第二结构化数据;若PDF文档中包含表格,则根据文档元数据字典对PDF文档进行多模态特征提取及特征融合,得到多模态融合特征,并根据多模态融合特征生成第三结构化数据;本申请提高了PDF文档的解析精度及效率。

本发明授权一种非结构化PDF文档智能解析方法、装置、设备及介质在权利要求书中公布了:1.一种非结构化PDF文档智能解析方法,其特征在于,所述方法包括: 获取待解析的PDF文档,并解析所述PDF文档中的页面元素,生成文档元数据字典;所述文档元数据字典中包括页面数量及元素分布; 基于所述文档元数据字典,判断所述PDF文档中是否包含可提取文本; 若所述PDF文档中未包含可提取文本,则将所述PDF文档转换为图像,并进行光学字符识别,生成第一结构化数据; 若所述PDF文档中包含可提取文本,则采用传统视觉方法及深度学习算法判断所述PDF文档中是否包含表格,具体包括:采用OpenCV边缘检测算法和霍夫变换筛选所述PDF文档中的水平线条,并计算水平线条密度;采用深度学习算法对所述非结构化PDF文档进行目标检测,确定表格检测结果;所述表格检测结果包括表格边界框、置信度及类别标签;根据所述水平线条密度及所述表格检测结果,判断所述PDF文档中是否包含表格; 若所述PDF文档中不包含表格,则采用PDFMiner提取文本,生成第二结构化数据; 若所述PDF文档中包含表格,则根据所述文档元数据字典,对所述PDF文档进行多模态特征提取及特征融合,得到多模态融合特征,并根据所述多模态融合特征生成第三结构化数据;其中,所述第一结构化数据、所述第二结构化数据或所述第三结构化数据为所述PDF文档的解析结果; 其中,根据所述文档元数据字典,对所述PDF文档进行多模态特征提取及特征融合,得到多模态融合特征,具体包括: 根据所述文档元数据字典,对所述PDF文档进行文本语义标记、图像分块校准及坐标校准处理,得到预处理文本语义数据、预处理图像数据及预处理坐标数据; 分别对所述预处理文本语义数据、所述预处理图像数据及所述预处理坐标数据进行特征提取,得到文本语义向量、视觉特征向量及坐标特征向量; 采用三模态交叉注意力机制,对所述文本语义向量、所述视觉特征向量及所述坐标特征向量进行跨模态注意力融合,量化文本与视觉元素的语义-空间关联度; 根据所述语义-空间关联度、所述文本语义向量、所述视觉特征向量及所述坐标特征向量,采用预先训练的神经网络模型,动态调节文本、视觉及坐标的权重,得到文本权重、视觉权重及坐标权重; 根据所述文本权重、所述视觉权重及所述坐标权重,对所述文本语义向量、所述视觉特征向量及所述坐标特征向量进行加权求和,得到多模态融合特征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人陆泽科技有限公司,其通讯地址为:116023 辽宁省大连市沙河口区软件园路8-4号B3座三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。