Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司刘锐获国家专利权

国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司刘锐获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司申请的专利PDF文档水印识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116311294B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310249443.3,技术领域涉及:G06V30/40;该发明授权PDF文档水印识别方法及系统是由刘锐;孙毅臻;李自尊;田峥;陈中伟;李树;杨欢驰;蔡哲儒;李永发;田楠;戴大维;陶凯设计研发完成,并于2023-03-15向国家知识产权局提交的专利申请。

PDF文档水印识别方法及系统在说明书摘要公布了:本发明公开了一种PDF文档水印识别方法,包括获取现有的PDF文档并提取文本;对文本预处理得到语料数据;对语料数据进行分词并建立分词模型;对分词模型进行训练;采用训练后的分词模型对目标PDF进行处理,完成文字水印的识别。本发明还公开了一种实现所述PDF文档水印识别方法的系统。本发明采用自然语言处理技术与位图识别相结合的方法,能较好地提高识别的准确率,而且可靠性高、精确性好且快速安全。

本发明授权PDF文档水印识别方法及系统在权利要求书中公布了:1.一种PDF文档水印识别方法,包括如下步骤: S1.获取现有的PDF文档并进行文本提取; S2.对步骤S1提取的文本进行预处理,从而得到语料数据; S3.对步骤S2得到的语料数据进行分词,并基于N-gram模型建立分词模型; S4.对步骤S3构建的分词模型进行训练;具体包括如下步骤: 采用如下算式计算一个句子w1,w2,...,wx的概率PS: PS=pw1pw2|w1...pwx|w1,w2,...,wx-1 式中pw1为词w1在文本中出现的概率;pw2|w1为前一个词是w1同时后一个词是w2的组合在文本中出现的次数;pwx|w1,w2,...,wx-1为词序列w1,w2,...,wx-1后面为wx的组合在文本中出现的次数; 计算时,引入马尔科夫假设,将上述计算问题转换为3-gram模型,并采用如下算式表示: 式中pwi|wi-2,wi-1为wi出现时前面为wi-2,wi-1的概率; 建立KenLM算法来求解公式 在分词后的文本内容中的每一句话开头与结尾分别加上设定的起始符和设定的终止符; 初始计数:采用极大似然估计方法,得到其中,Cwi-2wi-1wi为词序列wi-2wi-1wi出现的频次,Cwi-2wi-1为词序列wi-2wi-1出现的频次; 调整初始计数:采用如下算式调整初始计数: 式中为词序列wi-2wi-1wi的调整计数;v为表示词序列后面所接的词;为当词序列wi-2wi-1wi后所接的词为v时的词频; 计数打折:采用如下算式计算打折后的计数: 式中D3k为3-gram的折扣值;k为某个3-gram词序列出现的次数;tk为出现了k次3-gram的个数; 计算伪概率:采用如下算式计算得到伪概率: 式中为词序列wi-2,wi-1后面为wi的伪概率;为词序列wi-2wi- 1wi的调整计数;为词序列wi-2,wi-1,v的调整计数;v代表任意一个可能跟在词序列后的词; 计算回退权值:采用如下算式计算回退权值: 式中为词序列wi-2,wi-1的回退权值;为词序列wi-2,wi-1,v的调整计数为k的次数; 插值:采用如下插值公式计算最终的条件概率: 式中pwi|wi-1,wi-2为最终的条件概率; S5.采用训练后的分词模型,对目标PDF进行处理,完成文字水印的识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司,其通讯地址为:410004 湖南省长沙市天心区新韶东路398号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。