桂林电子科技大学蔡晓东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林电子科技大学申请的专利一种视频文本检索方法、装置、系统以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115757873B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211477636.6,技术领域涉及:G06F16/783;该发明授权一种视频文本检索方法、装置、系统以及存储介质是由蔡晓东;龙顺宏设计研发完成,并于2022-11-23向国家知识产权局提交的专利申请。
本一种视频文本检索方法、装置、系统以及存储介质在说明书摘要公布了:本发明提供一种视频文本检索方法、装置、系统以及存储介质,属于视频处理领域,方法包括:将视频随机划分为训练集和测试集;对视频以及自然语言文本描述进行预处理得到目标视频画面块序列;构建视频编码器和视觉语义监督编码器,并利用视觉语义监督编码器以及目标视频画面块序列对视频编码器进行训练得到训练后视频编码器以及视频文本距离。本发明保证了编码器的高效率的同时,能够有效的挖掘出视频数据的时空信息和文本数据的上下文信息,实现了更加精确的语义对齐,能够有效的提升了视频文本检索的效果,而且具有一定的泛化能力,提高了模型的可靠性和稳定性。
本发明授权一种视频文本检索方法、装置、系统以及存储介质在权利要求书中公布了:1.一种视频文本检索方法,其特征在于,包括如下步骤: 导入多个视频以及与各个所述视频一一对应的多个自然语言文本描述,并将所有所述视频随机划分为训练集和测试集; 分别对所述训练集中各个所述视频以及对应的所述自然语言文本描述进行预处理,得到所述训练集中各个所述视频的多个目标视频画面块序列; 构建视频编码器和视觉语义监督编码器,并利用所述视觉语义监督编码器以及所述训练集中各个所述视频的多个目标视频画面块序列对所述视频编码器进行训练,得到训练后视频编码器以及各个所述目标视频画面块序列的视频文本距离; 利用所述训练后视频编码器分别对各个所述目标视频画面块序列的视频文本距离进行编码,得到各个所述目标视频画面块序列的视频特征; 利用文本编码器分别对各个所述目标视频画面块序列进行编码,得到各个所述目标视频画面块序列的文本特征; 分别根据各个所述目标视频画面块序列的视频特征和文本特征进行损失函数分析,得到各个所述目标视频画面块序列的多个损失函数; 根据各个所述目标视频画面块序列的多个损失函数分别对所述视觉语义监督编码器以及所述训练后视频编码器进行参数更新,得到更新后视觉语义监督编码器以及更新后视频编码器; 利用所述更新后视觉语义监督编码器以及所述更新后视频编码器对所述测试集进行视频文本检索处理,得到视频文本检索结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林电子科技大学,其通讯地址为:541004 广西壮族自治区桂林市七星区金鸡路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。