南京邮电大学刘天山获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利基于情境记忆提示的跨模态视频时序内容定位方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119672611B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411846632.X,技术领域涉及:G06V20/40;该发明授权基于情境记忆提示的跨模态视频时序内容定位方法及系统是由刘天山;鲍秉坤设计研发完成,并于2024-12-16向国家知识产权局提交的专利申请。
本基于情境记忆提示的跨模态视频时序内容定位方法及系统在说明书摘要公布了:本发明公开了基于情境记忆提示的跨模态视频时序内容定位方法及系统,涉及跨模态理解技术领域,通过阶段一动态产生一组情境记忆,显式总结输入视频中发生的多种行为实例;通过施加判别性和多样性约束来制定无监督记忆学习范式,消除对额外行为实例标注的依赖。其次,阶段二中基于帧级别细节内容补充和语言查询交互获取增强的记忆提示,并进一步作为锚框,实现对目标时刻片段边界的精准高效回归。与传统的基于滑动窗口或基于多尺度锚框的策略相比,本发明提出的跨模态视频时序内容定位方法更加符合认知习惯,在处理长视频时具备性能和效率优势。
本发明授权基于情境记忆提示的跨模态视频时序内容定位方法及系统在权利要求书中公布了:1.基于情境记忆提示的跨模态视频时序内容定位方法,其特征在于,方法包括以下步骤: 接收输入视频序列,将输入视频序列输入至预先训练的视觉骨干网络模型内,输出得到初始视频表征,将初始视频表征输入至预先建立的Transformer模块内,输出得到动态情境记忆数据集; 基于动态情境记忆数据集内的记忆条目计算得到预测的行为类别得分向量以及各行为实例对应的时序中心坐标和跨度,根据各行为实例对应的时序中心坐标的先后顺序将动态情境记忆数据集进行重新排序得到记忆提示集; 接收读入单词数据,将读入单词数据输入至预先训练的语言模型内,输出得到文本查询表征,计算记忆提示集与文本查询表征的匹配度得分,选取匹配度得分最高的若干个记忆提示组成锚框子集; 将锚框子集和初始视频表征输入至Transformer模块内,输出得到帧级别内容增强的锚框表征,将文本查询表征作为引导信息,分别与锚框子集和帧级别内容增强的锚框表征进行逐元素相乘计算,得到最终的跨模态表征; 将最终的跨模态表征输入至预先建立的基于前馈网络的回归器内,输出得到预测偏差,基于预测偏差调整初始的锚框边界,得到最终的目标时刻定位结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210023 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励