北京百度网讯科技有限公司吴怡灵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京百度网讯科技有限公司申请的专利文档处理方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119378539B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411472701.5,技术领域涉及:G06F40/258;该发明授权文档处理方法、装置、电子设备及存储介质是由吴怡灵设计研发完成,并于2024-10-21向国家知识产权局提交的专利申请。
本文档处理方法、装置、电子设备及存储介质在说明书摘要公布了:本公开实施例提供了文档处理方法、装置、电子设备及存储介质,涉及自然语言处理NLP、智能搜索等领域。具体实现方案为:对待处理文档进行标题提取处理,得到多个疑似标题数据;对多个疑似标题数据分别进行标题头提取处理,得到多个疑似标题数据对应的多个标题头;对多个标题头分别进行编码处理,得到多个标题头对应的多个编码;对多个编码进行配对处理,根据得到的至少一对配对编码确定层级关系信息,层级关系信息包括至少一个层级和至少一个层级对应的编码;根据层级关系信息对多个疑似标题数据进行处理,得到待处理文档中的标题和标题层级。本公开实施例可以召回和准确地提取文档标题和标题层级。
本发明授权文档处理方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文档处理方法,包括: 对待处理文档进行标题提取处理,得到多个疑似标题数据; 对所述多个疑似标题数据分别进行标题头提取处理,得到所述多个疑似标题数据对应的多个标题头;所述标题头为标题开头的编号信息; 对所述多个标题头分别进行编码处理,得到所述多个标题头对应的多个编码;其中,所属同一层级的标题的标题头对应相同的编码; 对所述多个标题头对应的多个编码进行配对处理,根据得到的至少一对配对编码确定层级关系信息,所述层级关系信息包括至少一个层级和所述至少一个层级对应的编码; 根据所述层级关系信息对所述多个疑似标题数据进行处理,得到所述待处理文档中的标题和标题层级; 其中,所述对所述多个标题头对应的多个编码进行配对处理,根据得到的至少一对配对编码确定层级关系信息,包括: 按照所述多个标题头中标题头的顺序,将所述多个编码中相邻两个不同的编码进行配对,得到至少一对配对编码; 确定所述至少一对配对编码在配对过程中出现的个数; 根据所述出现的个数对所述至少一对配对编码进行排序,并根据排序后的所述至少一对配对编码确定所述层级关系信息,包括:按照所述出现的个数大小,将所述至少一对配对编码进行排序;基于排序后的所述至少一对配对编码中编码的位置关系,确定所述层级关系信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦二层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励