浙江工业大学刘盛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利基于DETR的人物成对解码交互的人与物交互检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115147931B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210864552.1,技术领域涉及:G06V40/20;该发明授权基于DETR的人物成对解码交互的人与物交互检测方法是由刘盛;张峰;陈俊皓;郭炳男;陈瑞祥设计研发完成,并于2022-07-21向国家知识产权局提交的专利申请。
本基于DETR的人物成对解码交互的人与物交互检测方法在说明书摘要公布了:本发明公开了一种基于DETR的人物成对解码交互的人与物交互检测方法,将图片通过训练好的DETR模型,获得人物目标框、目标类别和查询向量,从而减少模型训练时间。然后将查询向量和目标类别输入到查询向量分类器,得到人的查询向量、物的查询向量和物的类别;将物的类别输入到语义网络,得到物的语义查询向量,融合物的查询向量和物的语义查询向量,得到融合的物查询向量,将融合的物查询向量和人的查询向量进行合并,得到对象查询向量。最后将对象查询向量输入到成对融合检测网络,实现人物交互检测。本发明提高了人与物交互检测的精度,扩大了网络的感受野,提高了网络的性能。
本发明授权基于DETR的人物成对解码交互的人与物交互检测方法在权利要求书中公布了:1.一种基于DETR的人物成对解码交互的人与物交互检测方法,其特征在于,所述基于DETR的人物成对解码交互的人与物交互检测方法,包括: 将原始图像经过骨干网络得到的特征图注入训练好DETR网络,所述DETR网络包括编码器、解码器和MLP层,获得解码器输出的查询向量,以及DETR网络最终输出的目标框及目标类别; 将查询向量和目标类别输入到查询向量分类器,得到人的查询向量、物的查询向量和物的类别; 将物的类别输入到语义网络,得到物的语义查询向量; 融合物的查询向量和物的语义查询向量,得到融合的物查询向量,将融合的物查询向量和人的查询向量进行合并,得到对象查询向量; 将对象查询向量输入到成对融合检测网络,实现人物交互检测; 其中,所述成对融合检测网络依次包括改进的Transformer编码器、成对融合模块、Transformer解码器和MLP层; 所述改进的Transformer编码器,输入特征分别是对象查询向量和成对框位置编码,在改进的Transformer编码器中,将对象查询向量配对后与成对框位置编码结合,通过线性层和sigmoid激活函数,得到第一分支的输出;将对象查询向量复制后与成对框位置编码元素相乘,得到第二分支的输出;将两个分支的输出元素相乘后通过线性层,并与输入的对象查询向量相加,再经过归一化层,前向传播层和归一化层,输出成对查询向量; 在成对融合模块中,成对查询向量分别与成对框位置编码和经过自适应平均池化的全局视觉特征进行结合操作后,经过线性层后相乘,之后依次经过ReLU激活函数、线性层和ReLU激活函数得到最后的融合了多种特征的成对查询向量; 将融合了多种特征的成对查询向量经过Transformer解码器解码后,输出MLP中,得到人-物交互动作的概率分数,从而完成对人-物交互动作的检测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。