山西大学王元龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山西大学申请的专利一种基于关系标签层次结构的视觉关系检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115861697B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211581094.7,技术领域涉及:G06V10/764;该发明授权一种基于关系标签层次结构的视觉关系检测方法是由王元龙;雷鸣;王智强;胡文博;刘晓敏设计研发完成,并于2022-12-07向国家知识产权局提交的专利申请。
本一种基于关系标签层次结构的视觉关系检测方法在说明书摘要公布了:本发明属于计算机视觉领域,具体涉及一种基于关系标签层次结构的视觉关系检测方法。包括以下步骤:步骤1,获得关系样例概率分布;步骤2,子层次结构构建;步骤3,子层次结构聚合;步骤4,构建基于关系标签层次结构的损失函数;步骤5,获取视觉特征;步骤6,获取相对位置特征;步骤7,获取语言特征;步骤8,特征融合进行关系预测。基于关系标签层次结构的视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术,以此来提高计算机对图片理解的能力。
本发明授权一种基于关系标签层次结构的视觉关系检测方法在权利要求书中公布了:1.一种基于关系标签层次结构的视觉关系检测方法,其特征在于,包括以下步骤, 步骤1,获得关系样例概率分布; 步骤2,子层次结构构建; 步骤3,子层次结构聚合; 步骤4,构建基于关系标签层次结构的损失函数; 步骤5,获取视觉特征; 步骤6,获取相对位置特征; 步骤7,获取语言特征; 步骤8,特征融合进行关系预测; 所述步骤2中子层次结构构建的过程是将关系区分为粗粒度关系和细粒度关系; 所述步骤3中子层次结构聚合具体为:每层将关系归纳为比下一层中的关系更粗的关系,其中虚拟节点不代表任何一个关系标签,只是一个模糊的概念; 所述步骤4中关系标签层次结构的损失函数公式为: L=λLP+CBsigmoid 其中,λ是平衡权重,LP表示基于标签路径的损失,CBsigmoid表示类平衡 sigmoid损失; 对于基于标签路径的损失,标签层次结构中用正确路径Lpath跟踪从虚拟根结点到关系结点的路径,标签结构的正确路径表示对于一个训练样例在标签层次结构中正确的分类路径,对于给定带有一个正确路径Lpath的样例,计算标签层次结构各层交叉熵损失以及正确样例的路径损失,得到基于标签路径的损失LP公式为: 其中,Bi表示结点i的兄弟结点,路径概率正确标签Dlobel,每个结点的概率公式为: 其中,对于给定关系类r的样本,带有偏见性的视觉关系检测模型预测的概率为pr,Li表示结点i的所有叶子结点,leafi=T表示结点i为叶子结点,classi=r表示结点i为关系类r,leafi=F表示结点i不是叶子结点; 对于每一个节点i的孩子节点j∈Ci的概率计算公式为: [j|i=SoftmaxZi[j]; 一个叶子结点表示一个关系类r,从根节点到类r叶子结点的路径为Lpath,已知节点i属于路径Lpath,遍历下一个节点Cri∈Lpath∩Ci,概率表示为PLCri|i,最终,对每一个关系类r路径概率表示公式为: 类平衡权重表示标签层次结构中每个结点的平衡权重,采用权重因子来计算每个结点的类平衡权重,并统一定义每个结点的类平衡权重,公式为: 其中超参数β∈[0,1; 对于给定一个样例的正确关系r,基于带有偏见的预测概率Ppre计算类平衡sigmoid损失函公式为: 其中,wi是关系类i的权重因子。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山西大学,其通讯地址为:030006 山西省太原市坞城路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。