Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山西大学曹付元获国家专利权

山西大学曹付元获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山西大学申请的专利一种基于候选谓词关系偏差的无偏场景图生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116645501B

龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310759058.3,技术领域涉及:G06V10/25;该发明授权一种基于候选谓词关系偏差的无偏场景图生成方法是由曹付元;郝昊宇设计研发完成,并于2023-06-26向国家知识产权局提交的专利申请。

一种基于候选谓词关系偏差的无偏场景图生成方法在说明书摘要公布了:本发明一种基于候选谓词关系偏差的无偏场景图生成方法属于计算机视觉理解领域,本发明利用候选谓词之间相似性的关系调节模型对于头部谓词和尾部谓词的平衡,使之可以在以往生成去偏场景图的基础上将语义相似的谓词进行区分,并取得了显著的效果,一方面控制了召回率没有出现很大的下降,另一方面有效的提升了平均召回率,使得场景图生成模型较之以往得到更加丰富、更加细粒度的语义信息,超越了当下一些主流的无偏场景图生成模型,在实际应用当中有着广泛的用途,在视觉问答、图片分割、图片检索等一系列下游任务当中可以充分发挥价值。

本发明授权一种基于候选谓词关系偏差的无偏场景图生成方法在权利要求书中公布了:1.一种基于候选谓词关系偏差的无偏场景图生成方法,其特征在于,按照以下步骤: 步骤1,选取数据集中的图片进行预处理并将数据集划分; 步骤2,使用已经训练好的目标检测网络FasterRCNN从预处理之后的数据集图片中得到该图片的目标候选框Objectproposals以及相关的特征,对于每一张图片中的任何一个候选框来说,使用目标检测器计算出它的视觉特征gv、边界框坐标bv、候选框对应的目标实体的分类分数zv,除此之外,还使用主干网络生成俩个目标候选框对应的实体s和o的联合特征gUs,o; 步骤3,构建目标候选框的空间特征,对于每一个候选框,使用步骤2中得到的边界框坐标bv计算候选框的空间特征posbv; 步骤4,构建目标候选框的语义特征,在步骤2中得到的候选框对应实体分类分数zv中选出最高得分对应的实体类别作为实体的标签cv,将cv加入词向量模型当中计算得到的结果edbcv作为语义特征,edb是一种用于获取词的向量表示的无监督学习模型GloVe; 步骤5,构建目标实体编码器得到目标实体的上下文特征表示以及实体类别,根据上述目标检测器所得的特征,将步骤2中得到的视觉特征gv和步骤3中得到的空间特征posbv以及步骤4中得到的语义特征edbcv进行拼接操作,将得到的目标特征输入到no目标编码器中获得最终的目标特征表示将输入目标分类器以及激活函数当中,输出的结果为该目标候选框所属对象类别的预测分数pv; 步骤6,构建实体间关系编码器得到关系上下文的特征表示以及关系类别,对于一张图片中每一个有向对s,o来说,首先将步骤5中得到的实体s的最终特征表示和实体o的最终特征表示以及步骤2中得到的实体s和o的联合特征表示进行拼接得到初始的关系特征表示,再经过线性变化层对向量的维度进行变换,将变化之后的关系特征表示输入和步骤5中no目标编码器构造一样的nr关系编码器中,输出结果得到实体s和实体o的最终关系表示特征最后先将最终关系表示特征输入关系分类器中得到关系分类分数zs,o,将关系分类分数zs,o输入到激活函数当中最终得到俩个实体对象之间的关系预测分数ps,o; 步骤7,构建候选谓词关系偏差,使用候选谓词关系偏差调节模型在不同实体关系下的强度,统计步骤6中得到的关系分类分数zs,o中每对实体间关系分数最高的前mr名候选谓词出现的次数构建候选谓词矩阵ms,o,利用候选谓词矩阵ms,o计算生成候选谓词关系偏差b; 步骤8,构建损失函数,用步骤6中关系分类分数zs,o减去步骤7中谓词关系偏差b后输入激活函数得到新的实体对象间关系预测分数再将步骤5中得到的对象所属类别的预测分数pv和实体对象间关系预测分数分别和对应的标签向量一起输入交叉熵损失函数计算得到各自的损失值; 步骤9,训练模型,根据步骤8中计算得到的实体和关系对应的损失值,利用反向传播算法对步骤5和步骤6中构建的目标实体编码器和关系编码器的参数进行梯度回传,再进行不断优化,直至整个网络模型收敛; 步骤10,实体和关系预测值计算,将每个候选框的分类分数向量进行排序,选择最高分数对应的类别作为其预测类别;将候选框间关系的分类分数向量进行排序,选择最高分数对应的关系作为其关系类别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030024 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。