Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京欣博友数据科技有限公司请求不公布姓名获国家专利权

北京欣博友数据科技有限公司请求不公布姓名获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京欣博友数据科技有限公司申请的专利基于框坐标的PDF文本提取方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121033854B

龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511133076.6,技术领域涉及:G06V30/14;该发明授权基于框坐标的PDF文本提取方法和装置是由请求不公布姓名设计研发完成,并于2025-08-13向国家知识产权局提交的专利申请。

基于框坐标的PDF文本提取方法和装置在说明书摘要公布了:本申请公开了一种基于框坐标的PDF文本提取方法和装置,涉及文本提取技术领域。该方法包括:根据设置有框坐标的若干原始文本块,对PDF文档进行版面分析,得到设置有框坐标和类型标签的若干标准文本块;对设置有框坐标和类型标签的若干标准文本块进行有向图建模,得到有向图;使用群智能优化算法,获取有向图的文本排序路径,并根据文本排序路径,对有向图对应的标准文本块进行连接,得到PDF文本流。解决了现有技术存在的对复杂版式适应性差、语义理解能力弱以及缺乏全局优化视角的问题。

本发明授权基于框坐标的PDF文本提取方法和装置在权利要求书中公布了:1.一种基于框坐标的PDF文本提取方法,其特征在于,所述方法包括: 对PDF文档进行图像渲染与OCR处理,得到设置有框坐标的若干原始文本块; 根据设置有框坐标的若干原始文本块,对PDF文档进行版面分析,得到设置有框坐标和类型标签的若干标准文本块; 对设置有框坐标和类型标签的若干标准文本块进行有向图建模,得到有向图; 使用群智能优化算法,获取有向图的文本排序路径,并根据文本排序路径,对有向图对应的标准文本块进行连接,得到PDF文本流; 所述的群智能优化算法为MORFO算法; 包括: 将有向图中的每一节点对应的标准文本块视为一个待排序的独立点,将确定所有标准文本块最终阅读顺序的过程,建模为一个寻找独立点排列序列的组合优化问题; 根据组合优化问题,设定多目标优化函数,并基于多目标优化函数,使用MORFO算法,获取有向图的文本排序路径,包括: 根据组合优化问题,构建以阅读顺序流畅性、空间邻近性、对齐一致性以及版式结构贴合度为优化目标的多目标优化函数; 将多目标优化函数作为适应度函数,并设定MORFO算法的MORFO种群参数和最大迭代次数; 根据MORFO种群参数,使用Tent混沌映射序列进行初始化,得到初始的MORFO种群;所述的MORFO种群中每一MORFO个体对应于一备用的文本排序路径; 在探索阶段,通过随机游走搜索解空间,对初始的MORFO种群进行迭代更新,并根据适应度函数和精英保留策略,保留在每一次迭代的更新的MORFO种群的第一最优解; 引入动态反向机制,以概率p,生成每一次迭代的更新的MORFO种群的若干反向解,并根据适应度函数,在对应的第一最优解和若干反向解中选择全局更优解; 在开发阶段,引入Levy飞行机制,围绕全局更优解进行精细搜索,得到局部最优解,并根据适应度函数,在局部最优解和全局更优解中选择第二最优解; 在迭代次数达到最大迭代次数或第二最优解的适应度函数值满足要求时,终止对MORFO种群的迭代更新,并将当前迭代的第二最优解作为最终最优解进行输出; 对最终最优解对应的MORFO个体的个体向量进行解码,得到有向图的最优的文本排序路径; 根据文本排序路径,遍历有向图中对应的节点,并将每一节点对应的标准文本块进行连接,得到PDF文本流。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京欣博友数据科技有限公司,其通讯地址为:100085 北京市海淀区创业路8号3号楼3-3-2;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。