杭州电子科技大学姜明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利基于注意力修正的图神经网络的视觉文档信息抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119919954B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411964079.X,技术领域涉及:G06V30/413;该发明授权基于注意力修正的图神经网络的视觉文档信息抽取方法是由姜明;龚锴睿;张旻设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本基于注意力修正的图神经网络的视觉文档信息抽取方法在说明书摘要公布了:本发明涉及基于注意力修正的图神经网络的视觉文档信息抽取方法,包括先依据实体及其文本内容与文本框信息提取实体节点图像、文本、布局特征,获取文档中各实体节点相邻最近的n个实体节点索引以生成边邻接矩阵,后将实体节点特征与边邻接矩阵输入GraphSAGE图网络模型学习节点特征,此过程融合图卷积与基于结构特征的注意力修正机制,依据节点特征距离与度信息计算并修正边权重,经多层图卷积与修正操作后输出特征表示,输入全连接层完成节点分类,对文档采样获取实体节点对及边特征,融合后再输入全连接层进行边分类。该方法借助GraphSAGE模型,有效融合多模态信息,精准捕捉节点与图结构特性,动态调整节点关系与权重,显著提升实体节点分类准确率。
本发明授权基于注意力修正的图神经网络的视觉文档信息抽取方法在权利要求书中公布了:1.基于注意力修正的图神经网络的视觉文档信息抽取方法,其特征在于:包括以下步骤: 步骤一:使用光学字符识别获取文档中若干实体以及实体所对应的文本内容、文本框坐标值和文本框尺寸,根据文本框坐标值和长宽表示实体节点布局特征,使用残差网络提取文档全局图像特征,再利用RoI对齐层获取区域级实体节点图像特征,并通过spacy模型提取文档的实体节点文本特征; 步骤二:对步骤一获取的实体节点图像特征、实体节点文本特征、实体节点布局特征通过计算各模态特征之间的交互关系以及对整体任务的贡献度,生成对应的注意力权重向量,然后用这些权重向量分别对各模态特征进行加权融合,得到最终的多模态融合实体节点特征; 步骤三:对文档里的各个实体节点,查找与之相邻最近的n个实体节点,对实体节点文本框左上角、右下角以及中心点之间的综合距离展开计算,得出最近的n个实体节点索引,用以生成边邻接矩阵; 步骤四:先使用基于节点特征距离计算注意力权重的方式,对步骤二获取的实体节点特征以及步骤三的边邻接矩阵,在GraphSAGE图网络模型的第一层中,以加权求和操作聚合邻居节点特征并结合注意力权重计算聚合后的邻居特征,后将节点自身特征与聚合后的邻居特征拼接,通过权重矩阵与激活函数完成特征更新得到第一层的节点特征,在学习过程中,于注意力修正层,综合节点度信息与基于节点特征距离的中间注意力系数计算修正后的注意力权重并归一化,以此优化边权重,增强特征表示,接着进行第二层GraphSAGE卷积操作,以加权求和方式聚合邻居特征并更新节点特征; 步骤五:将经过两层GraphSAGE卷积及注意力修正后的特征输入到全连接层进行特征融合,并通过线性层实现实体节点的分类; 步骤六:对原始文档进行图采样,获取实体节点对,边特征由实体节点之间的关系特征、实体节点的阅读顺序特征、极坐标特征,步骤四经过图神经网络学习后的实体节点特征组成,四种特征融合得到最终边特征; 步骤七:将步骤六中最终边特征输入到全连接层进行边分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励