苏州空天信息研究院潘宇顺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州空天信息研究院申请的专利一种基于链接矩阵的跨模态事件联合抽取方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117009496B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310579818.2,技术领域涉及:G06F16/335;该发明授权一种基于链接矩阵的跨模态事件联合抽取方法及其系统是由潘宇顺;胡岩峰;彭晨;乔雪;顾爽;程嘉远;向镐鹏;闵飞;胡政设计研发完成,并于2023-05-22向国家知识产权局提交的专利申请。
本一种基于链接矩阵的跨模态事件联合抽取方法及其系统在说明书摘要公布了:本发明公开一种基于链接矩阵的多模态事件联合抽取方法,确定应用领域的事件结构体系,构建跨模态事件抽取数据集;构建图像块和文本序列之间的链接矩阵;基于ViLT构建多模态事件抽取模型,其中多模态Transformer编码器以图像块像素特征、词例特征和图像分块‑文本词例对特征为输入,得到多模态特征输入解码器,获取图文事件类型一致性特征、事件类型特征和图文事件要素特征;利用极大似然估计,取最大概率的图文事件类型匹配结果、事件类型、图文事件要素作为索引,利用索引映射得到文本事件信息。本发明解决了弱监督和无监督方法识别精度低,管道式多模态事件要素信息匹配不准确的问题,为多模态信息抽取领域提供了一种新的事件抽取策略。
本发明授权一种基于链接矩阵的跨模态事件联合抽取方法及其系统在权利要求书中公布了:1.一种基于链接矩阵的多模态事件联合抽取方法,其特征在于,包括如下步骤: 步骤1:确定应用领域的事件结构体系,包括事件的细粒度类型和事件要素,获取文本事件标注信息、图像事件标注信息、跨模态事件标注信息以及原始图像和文本信息,构建跨模态事件抽取数据集; 步骤2:将图像拆分,构建图像块和文本序列之间的链接矩阵; 步骤3:基于ViLT构建多模态事件抽取模型,包括多模态Transformer编码器和针对不同任务的解码器,多模态Transformer编码器以图像块像素特征、词例特征和图像分块-文本词例对特征为输入,得到多模态特征输入解码器,获取图文事件类型一致性特征、事件类型特征和图文事件要素特征; 步骤4:根据图文事件类型一致性特征、事件类型特征和图文事件要素特征,利用极大似然估计,取最大概率的图文事件类型匹配结果、事件类型、图文事件要素作为索引,利用索引映射得到文本事件信息,包括事件触发词、事件类型、事件要素,以及图像事件信息,包括图像场景、事件类型、目标定位和事件要素; 步骤2,将图像拆分,构建图像块和文本序列之间的链接矩阵,具体方法为: 步骤2.1,进行图片预处理和文本预处理,其中图片预处理包括去噪和零填充,文本预处理包括去噪、停用词提取; 步骤2.2,将图像切片为若干个正方形片段,按照从左到右从上到下展开; 步骤2.3,将图像块作为横坐标,将文本序列作为纵坐标,构建图像块和文本序列之间的链接矩阵,所述链接矩阵为0,1的二值矩阵,当图像块与文本序列存在联系时,矩阵值为1,否则为0; 将图像mi分解为sizep×sizep大小的N个图像块,表示为mi={p1,p2,…,pN},其中pi代表每个图像块的像素特征向量;将文本句子表示为sj={w1,w2,…,wj,…,wL},其中,wj代表由词嵌入得到的词例特征向量,则图像分块-文本词例对表示为pi,wj,采用卷积神经网络提取图像分块-文本词例对的特征向量,表示为: hi,j=CNNpi,wj 根据图像分块-文本词例对的特征向量hi,j,由softmax函数预测配对结果为, 其中,yh代表图像分块-文本词例对的配对结果,Pyh|h为配对结果yh在链接矩阵真实值特征向量h'中的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州空天信息研究院,其通讯地址为:215000 江苏省苏州市苏州工业园区独墅湖大道158;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励