广西大学黄清宝获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广西大学申请的专利基于半结构化文本信息的指代表达理解方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120106042B 。
龙图腾网通过国家知识产权局官网在2025-12-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510134670.0,技术领域涉及:G06F40/205;该发明授权基于半结构化文本信息的指代表达理解方法是由黄清宝;苏俊源设计研发完成,并于2025-02-07向国家知识产权局提交的专利申请。
本基于半结构化文本信息的指代表达理解方法在说明书摘要公布了:本发明的基于半结构化文本信息的指代表达理解方法是通过对图像和文本进行特征提取,分别获取图像特征和文本特征;通过软切分模块对中文本特征进行处理,将文本特征切分为主语主导的文本编码和上下文主导的文本编码;在多模态Transformer融合模块中,计算图像特征和文本特征之间的相似度矩阵,生成多模态表征;基于此特征,通过渐进式推理模块分别进行两次框预测,每次预测生成预测框,计算预测框与标签框之间的绝对误差损失和广义交并比损失,并将绝对误差损失和广义交并比损失线性组合,形成优化函数,通并通过优化函数调整模型参数。该方法在多个基准数据集上显著提升了视觉定位的准确性和鲁棒性,为复杂语言查询的理解提供了高效解决方案。
本发明授权基于半结构化文本信息的指代表达理解方法在权利要求书中公布了:1.基于半结构化文本信息的指代表达理解方法,其特征在于,包括如下步骤: 步骤1,对图像和文本进行特征提取,分别获得图像特征和文本特征; 步骤2,通过软切分模块对步骤1中所述文本特征进行处理,将文本特征切分为主语主导的文本编码和上下文主导的文本编码; 所述通过软切分模块对文本特征进行处理的步骤如下: 步骤21,利用Stanza词语解析器对指代文本表达式进行标记,提取主语和上下文信息; 步骤22,通过逻辑判断提取出依赖项为nsubj形容词性物主代词的单词; 步骤23,将依赖项位置标为1,其余部分标为0,形成标识向量; 步骤24,根据标识向量,计算主语词和上下文词的平均值,并将主语词和上下文词的平均值拼接到特征向量的首位; 步骤25,在不同平均值的影响下,通过改进的注意力池化模块得到主语主导和上下文主导的注意力加权表示; 步骤3,在多模态Transformer融合模块中,计算得到步骤1中图像特征和文本特征之间的相似度矩阵,并基于相似度矩阵进行多模态信息融合,生成多模态表征; 步骤4,基于步骤3中所述多模态表征和上下文主导的文本编码,通过注意力机制计算得到上下文引导的特征值; 步骤5,通过渐进式推理模块,在步骤2中所述主语主导的文本编码和步骤4中所述上下文引导的特征值的影响下,分别进行两次框预测,每次预测生成预测框,预测框包括左上角横坐标、左上角纵坐标、宽度和高度; 步骤6,定义模型的优化函数,包括计算步骤4中所述预测框与标签框之间的绝对误差损失和广义交并比损失,并将所述绝对误差损失和广义交并比损失线性组合,形成优化函数,通过优化函数调整模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广西大学,其通讯地址为:530004 广西壮族自治区南宁市西乡塘区大学东路100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励