杭州越中档案信息技术有限公司董勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州越中档案信息技术有限公司申请的专利一种基于人工智能的档案分类识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120371789B 。
龙图腾网通过国家知识产权局官网在2025-10-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510845964.4,技术领域涉及:G06F16/16;该发明授权一种基于人工智能的档案分类识别方法及系统是由董勇;陈惠霞设计研发完成,并于2025-06-24向国家知识产权局提交的专利申请。
本一种基于人工智能的档案分类识别方法及系统在说明书摘要公布了:本发明涉及档案分类技术领域,具体公开了一种基于人工智能的档案分类识别方法及系统。本发明先获取待分类档案的含文档结构化与非文档结构化元数据,再根据文档结构化元数据获文本节点数据及文档初始痕迹、节点关联数据,据非文档结构化元数据获上下文关联、档案内容拆解节点数据并关联合并成节点数据链,依此构建动态知识图谱,生成待预存档案类目,若其不在预设类目内,用余弦相似度算法匹配相似预设类目,基于图谱补充语义得新定义标签类目,最后依新类目重新分类识别档案,同时文预设档案类目可随新类目扩展而动态优化,避免重复分类错误,且还能够避免待预设档案类目与预设档案类目不匹配时,出现无法对待预存档案类目进行分类识别的问题。
本发明授权一种基于人工智能的档案分类识别方法及系统在权利要求书中公布了:1.一种基于人工智能的档案分类识别方法,其特征在于,包括: 获取待分类档案的数字化数据,其中,数字化数据包括文档结构化元数据和非文档结构化元数据; 根据所述文档结构化元数据获取文本节点数据,并根据所述文本节点数据获取文档初始痕迹数据和节点关联数据,步骤具体为: 根据所述文档结构化元数据获取文本逻辑单元,其中,所述文本逻辑单元包括起始单元、分段单元和结束单元; 根据所述文本逻辑单元对所述文档结构化元数据进行拆分,得到文本节点数据; 根据所述文本节点数据获取所述待分类档案的流转信息,并根据所述流转信息溯源文档初始痕迹数据; 根据所述起始单元、所述分段单元和所述结束单元获取时间窗口内的递进的衔接数据,并根据所述衔接数据获取对应的衔接上下文数据,将所述衔接上下文数据作为节点关联数据; 根据所述非文档结构化元数据获取上下文关联数据和档案内容拆解节点数据,步骤具体为: 根据所述非文档结构化元数据获取待分类档案的存储路径层级和邮件线程结构,并根据所述存储路径层级和所述邮件线程结构获取跨档案组织拓扑; 根据所述跨档案组织拓扑获取多个连接节点; 根据多个所述连接节点获取对应的节点数据,对多个所述节点数据进行语义提取,得到多个节点语义数据; 将所述多个节点语义数据按照预设时间戳进行关联,得到上下文关联数据; 基于预设内容结构对所述非文档结构化元数据进行拆解,得到预设拆解路径,并按照预设拆解路径提取档案内容拆解节点数据; 并将所述节点关联数据和所述档案内容拆解节点数据进行关联合并,得到节点数据链,其中,根据所述文档初始痕迹数据、所述上下文关联数据和所述节点数据链获取动态知识图谱,并根据所述动态知识图谱获取待预存档案类目; 判断所述待预存档案类目是否处于预设档案类目内; 若待预存档案类目不处于,将所述待预存档案类目与预设档案类目进行相似度匹配,得到相似预设档案类目,并基于动态知识图谱对相似预设档案类目进行档案类目语义补充,得到新定义标签类目; 根据所述新定义标签类目对所述待分类档案进行重新分类识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州越中档案信息技术有限公司,其通讯地址为:310000 浙江省杭州市滨江区长河街道江晖南路7号5幢8楼802室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励