Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京邮电大学张伟获国家专利权

南京邮电大学张伟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京邮电大学申请的专利基于内容查询和位置查询的人物交互检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119693762B

龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510207309.6,技术领域涉及:G06V10/80;该发明授权基于内容查询和位置查询的人物交互检测方法是由张伟;吴帆;陈云芳设计研发完成,并于2025-02-25向国家知识产权局提交的专利申请。

基于内容查询和位置查询的人物交互检测方法在说明书摘要公布了:本申请适用于人物交互检测技术领域,提供了一种基于内容查询和位置查询的人物交互检测方法,包括:首先通过主干网络提取图像特征,并用目标检测器DETR检测人和物体实例,然后配对人物与物体实例,提取外观、空间和物体类别语义特征并计算交互性分数,选出交互提议,接着将多模态特征深度融合,生成内容和位置嵌入,传入Transformer解码器进行交叉注意力计算,得到交互特征,最后将交互特征输入分类器,结合置信度分数,输出人物交互三元组的分数。该方法通过深度融合多模态特征和交叉注意力机制,有效提高人物与物体交互的检测精度,能够准确识别复杂场景中的人物交互关系。

本发明授权基于内容查询和位置查询的人物交互检测方法在权利要求书中公布了:1.一种基于内容查询和位置查询的人物交互检测方法,其特征在于,包括如下步骤: S1、将待检测图像输入至主干网络中得到图像视觉特征,将其展平为多个一维向量,经过正弦位置编码增强,传入目标检测器DETR得到所有人实例和物体实例; S2、将人实例和物体实例一一配对获取多个人物对,提取人物对的多模态特征,所述多模态特征包括外观特征、空间特征及物体类别语义特征,将所述外观特征、所述空间特征及所述物体类别语义特征进行连接并传入多层感知机得到每个人物对的交互性分数,将分数最高的多个人物对确定为多个人物交互提议; S3、对S2中提取的人物对的多模态特征进行深度融合得到人物交互提议的内容嵌入,并利用人框和物体框的中心点坐标构建人物交互提议的位置嵌入; S4、将多个人物交互提议的内容嵌入和位置嵌入传入预设的Transformer解码器,生成内容查询和位置查询,并与图像特征、图像位置编码进行解耦式的交叉注意力计算,得到交互特征; S5、将交互特征传入动作分类器,得到每个动作类别的分数,结合S1得到的人实例和物体实例的置信度分数得到人物交互三元组的分数; 所述S3的方法具体如下: S301、对于每个人物交互提议,利用S2提取的人物对的多模态特征构建内容嵌入ec,方法如下: fas=MBFfa,fs fpair=MBFfas,fc ec=fpair 其中fa代表人物对的外观特征,fs代表人物对的空间特征,fc代表人物对的物体类别语义特征,MBF代表多分支融合模块; S302、对于每个人物交互提议,利用人框和物体框的中心点坐标构建位置嵌入ep,方法如下: ep=[φxh+φxo;φyh+φyo] 其中xh,yh为人框中心点的坐标,xo,yo为物体框中心点的坐标,φ·的作用是将标量映射到正弦嵌入空间,计算方式为其中i=1,2,3,...,d2。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。