量大(北京)信息科技研究院有限公司郭嘉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉量大(北京)信息科技研究院有限公司申请的专利一种基于人工智能的多模态文档自动校对方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120782394B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510899159.X,技术领域涉及:G06Q10/10;该发明授权一种基于人工智能的多模态文档自动校对方法及系统是由郭嘉;张志宵;王经纬设计研发完成,并于2025-07-01向国家知识产权局提交的专利申请。
本一种基于人工智能的多模态文档自动校对方法及系统在说明书摘要公布了:本申请公开了一种基于人工智能的多模态文档自动校对方法及系统,涉及数据处理技术领域,公开的方法包括:接收原始文档,并将原始文档转换为由多个不同格式类型的数据构成的结构化数据;根据各格式类型的数据选择对应的校验模型对结构化数据进行校对,得到各格式类型的数据对应的差异项;通过预设质量分级器确定各差异项对应的风险等级;根据各风险等级对各差异项进行修正。本申请通过结构化数据中不同格式类型的数据选择对应的校验模型对结构化数据进行校对,并通过预设质量分级器确定校对得到的差异项的风险等级,基于风险等级对差异项目进行修正,从而实现了结构化数据的自动校正,相较于人工校对的方式,有效提高了校对效率。
本发明授权一种基于人工智能的多模态文档自动校对方法及系统在权利要求书中公布了:1.一种基于人工智能的多模态文档自动校对方法,其特征在于,所述基于人工智能的多模态文档自动校对方法包括: 接收原始文档,并将所述原始文档转换为由多个不同格式类型的数据构成的结构化数据,所述不同格式类型的数据包括文本数据、表格数据、公式数据以及图像数据; 根据各所述格式类型的数据选择对应的校验模型对所述结构化数据进行校对,得到各所述格式类型的数据对应的差异项; 通过预设质量分级器确定各所述差异项对应的风险等级; 根据各所述风险等级对各所述差异项进行修正; 所述差异项至少包括文本差异项、表格差异项、公式差异项以及图像差异项,所述根据各所述格式类型的数据选择对应的校验模型对所述结构化数据进行校对,得到各所述格式类型的数据对应的差异项的步骤,包括: 通过预设文本校验模型、预训练语言模型以及预设格式规则对所述文本数据进行校验,得到所述文本差异项; 通过预设表格校验模型以及预设分析型数据库对所述表格数据进行校验,得到所述表格差异项; 通过第一CLIP校验模型对所述公式数据进行校验,得到所述公式差异项; 通过第二CLIP校验模型对所述图像数据进行校验,得到所述图像差异项; 所述文本差异项至少包括文本语义差异项以及文本内容差异项,所述通过预设文本校验模型、预训练语言模型以及预设格式规则对所述文本数据进行校验,得到所述文本差异项的步骤,包括: 通过预设文本校验模型基于所述文本数据的内容编排信息将所述文本数据转换为相互连接的文本块构成的文档图,并确定各文本图节点的特征向量,所述文档图中的文本图节点为文本数据中的文本块; 确定各所述文本图节点的异常分数,任一文本图节点的异常分数基于所述任一文本图节点的特征向量与相邻文本图节点的特征向量所确定; 判断各所述文本图节点的异常分数是否达到预设分数; 在存在异常分数达到所述预设分数的目标文本图节点时,将所述目标文本图节点标记为所述文本语义差异项; 基于预训练语言模型以及预设格式规则对所述文本数据进行内容校验; 在存在内容校验失败的目标文本内容时,将所述目标文本内容标记为所述文本内容差异项。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人量大(北京)信息科技研究院有限公司,其通讯地址为:100080 北京市海淀区北三环中路31号4号楼10层东半部1-11;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励