昆明理工大学余正涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种融合图像信息的越汉跨语言新闻文本摘要方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117218503B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311170803.7,技术领域涉及:G06V10/80;该发明授权一种融合图像信息的越汉跨语言新闻文本摘要方法是由余正涛;吴奇远;谭凯文;黄于欣设计研发完成,并于2023-09-12向国家知识产权局提交的专利申请。
本一种融合图像信息的越汉跨语言新闻文本摘要方法在说明书摘要公布了:本发明涉及一种融合图像信息的越汉跨语言新闻文本摘要方法,属于自然语言处理技术领域。本发明首先构建越汉多模态跨语言摘要数据集;其次利用文本编码器和图像编码器对越南语新闻文本和图像进行表征,再利用图文对比损失增强图像和文本表征的一致性,迫使越南语的表征空间趋近于与语言无关的图像表征空间,然后利用图文融合器进行图像和文本的有效融合,增强新闻文本的关键信息提取能力,最后利用摘要解码器生成中文摘要。本发明在一个较大规模的越汉跨语言新闻摘要数据集进行实验表明生成的摘要具备更高的ROUGE分数、信息量、简洁度和流畅度。
本发明授权一种融合图像信息的越汉跨语言新闻文本摘要方法在权利要求书中公布了:1.一种融合图像信息的越汉跨语言新闻文本摘要方法,其特征在于:所述方法的具体步骤如下: Step1、从互联网多个新闻网站上爬取越南语新闻文本及其对应新闻图像,并对其进行处理,构建越汉多模态跨语言摘要数据集; Step2、文本编码器负责将输入的越南语新闻文本转化为语义表征,捕捉关键信息和语义关联; Step3、图像编码器将输入的新闻图像转换为图像表征,提取图像中的视觉信息; Step4、图文对比损失通过最大化正样本相似性和最小化负样本相似性,将图像和文本之间的信息进行有效关联和整合; Step5、图文融合器将文本表征和图像表征进行融合,获取融合后的图文表征;通过充分捕获文本和图像之间的关联性,提取文本中的关键信息; Step6、摘要解码器使用融合后的图文特征作为输入,生成中文的摘要; 所述步骤Step5的具体步骤为: Step5.1、在进行图文融合前,利用多头注意力机制和前馈神经网络对文本进行进一步编码,得到输出然后结合图像编码器的输出进行图文融合,具有S个视觉特征向量序列,其中图文融合器的层数为6-L;L为编码器的层数; Step5.2、使用基于多头注意力融合,引入多个注意力头,采用多个并行的注意力头同时学习和捕捉不同的特征信息; 其中查询向量Q从输入文本特征中获取,键向量K和值向量V从输入视觉特征中获取,将向量Q,K,V相应地进行了线性投影,分别表示为Pq、Pk和Pv;Q=OcPq,K=OvPk,V=OvWv,采用一个跨模态多头注意实现对文本的筛选和重组,最终得到视觉特征D1; 最后,参考点积注意力融合连接输入的文本特征Oc与视觉特征D1,得到视觉引导的文本特征Oc′,随后,将这个特征通过线性变换P投影到所需的维度; O′c=ConcatOc,D1P。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。