Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆邮电大学钟福金获国家专利权

重庆邮电大学钟福金获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆邮电大学申请的专利一种基于视觉语义推理的动态场景图生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119540835B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411693283.2,技术领域涉及:G06V20/40;该发明授权一种基于视觉语义推理的动态场景图生成方法是由钟福金;闫娟;陈海洋;张青松设计研发完成,并于2024-11-25向国家知识产权局提交的专利申请。

一种基于视觉语义推理的动态场景图生成方法在说明书摘要公布了:本发明属于场景图生成子问题中的动态场景图生成领域,具体涉及一种基于视觉语义推理的动态场景图生成方法,包括:获取视频,将视频输入训练好的动态场景图生成模型,得到对象以及对象之间的关系类别,根据对象以及对象之间的关系类别构建视频的场景图结构;动态场景图生成模型包括:预训练好的对象检测器、时间关系编码模块、关系特征提取模块、空间知识编码器、时空关系解码模块以及分类模块;本发明计算相邻视频帧之间的视觉特征差异和语义特征差异并进行损失计算,为模型的正确预测提供方向;本发明利用空间编码器融合对象空间信息和时间依赖性,并利用先验知识筛选正确的关系标签,提高关系预测的准确性。

本发明授权一种基于视觉语义推理的动态场景图生成方法在权利要求书中公布了:1.一种基于视觉语义推理的动态场景图生成方法,其特征在于,包括:获取视频,将视频输入训练好的动态场景图生成模型,得到对象以及对象之间的关系类别,根据对象以及对象之间的关系类别构建视频的场景图结构;动态场景图生成模型包括:预训练好的对象检测器、时间关系编码模块、关系特征提取模块、空间知识编码器、时空关系解码模块以及分类模块; 动态场景图生成模型的训练过程包括: S1、获取训练集,训练集包括多个训练样本,每个训练样本包括视频及其先验知识;每个视频包括多个视频帧;根据训练集的先验知识构建对象对的知识矩阵;视频的先验知识包括:每个视频帧中的对象对及其在每种关系类型中的关系类别和关系标签; S2、将视频的每个视频帧输入预训练好的对象检测器,得到检测到的视频帧的对象及其对象信息;对象信息包括:对象特征、对象类别和对象检测框; S3、将视频帧的对象信息输入时间关系编码模块,得到视频的时间对象特征Z1; S4、将视频的视频帧的对象信息和时间对象特征Z1输入关系特征提取模块,得到视频的对象对的关系特征X2; S5、将关系特征X2和知识矩阵输入空间知识编码器,得到视频的对象对的空间关系特征Z2; S6、将视频的对象对的关系特征X2和空间关系特征Z2输入时空关系解码模块,得到视频的对象对的时空关系特征ZFin; S7、将时空关系特征ZFin和时间对象特征Z1输入分类模块,得到预测的对象对在每种关系类型中的概率分布向量Pv和关系类别以及预测的对象的类别概率分布向量PO;v为关系类型的索引; S8、根据视频的对象对的关系特征X2和预测的对象对的关系类别计算视觉特征差异和语义特征差异,根据视频的视觉特征差异、语义特征差异、概率分布向量Pv以及概率分布向量PO计算损失函数值,根据损失函数值更新动态场景图生成模型参数,当损失函数值最小时,得到训练好的动态场景图生成模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。