Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京工业大学任柯燕获国家专利权

北京工业大学任柯燕获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京工业大学申请的专利一种基于高级语义信息特征编码的视频描述方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116091978B

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310159288.6,技术领域涉及:G06V20/40;该发明授权一种基于高级语义信息特征编码的视频描述方法是由任柯燕;张淳;黄靖懿;边青云设计研发完成,并于2023-02-24向国家知识产权局提交的专利申请。

一种基于高级语义信息特征编码的视频描述方法在说明书摘要公布了:本发明提供一种基于高级语义信息特征编码的视频描述方法。该发明包括:通过人工智能网络预测输入视频序列中包含的多个独立事件,并输出各事件的起止时间以及相应文字描述;通过解耦地提取原生视频的空间与时序特征,摒弃传统骨干网络,保留更完整的语义信息;通过高级语义信息编码器以及特征融合模块提炼视频特征,对高级语义信息进行解码以获得视频描述特征,取得更好的描述效果;通过时间戳预测模块以及描述内容预测模块分别处理视频描述特征获得最终描述结果。本发明主要针对包含多个事件的视频,具有参数量低、精度高,方便对视频操作等特点;对于生成的描述信息,可根据应用场景实现分类、检索、辅助视听等任务。

本发明授权一种基于高级语义信息特征编码的视频描述方法在权利要求书中公布了:1.一种基于高级语义信息特征编码的视频描述方法,其特征在于, 由预处理模块、编码器、解码器、预测头组成;具体包括以下步骤: 1构建一种视频帧提取模块用于预处理视频输入;模块提取视频中最具代表性的关键帧的同时,对图像进行像素级和帧级向下采样,以便压缩处理获得等距间隔的视频帧序列;其中关键帧KEY的作用为保留场景完整空间信息,保证描述内容鲁棒性,而压缩视频序列SEQ用于增强事件动态感知,减少冗余空间信息,提升全局时序建模效果; 2网络构建一种基于transformer的高级语义信息编码器对像素特征编码;本编码器使用多头自注意力机制分别从空间与时间维度并行提取视频中高级语义信息特征; 3构建一种空间特征编码器;用于编码所述关键帧KEY内空间高级语义信息并完成网络空间流建模; 4构建一种时序特征编码器,用于编码所述视频序列SEQ内时间高级语义信息,从中获取视频的全局信息,包括事件数量、动作关系; 5构建一种基于多头自注意力机制的融合模块,对所述的空间高级语义信息和时间高级语义信息进行特征融合,进一步精炼空间与时序语义信息,去除冗余特征减少参数量; 6构建一种基于交叉注意力机制的解码器,用于将包含高级语义信息的隐含特征解码为事件描述及起止时间特征,其中的LSTM网络构成事件描述生成器,用于将解码器所得特征通过生成模型预测事件描述内容; 7构建一种基于高级语义信息的事件起止时间预测器,用于通过融合事件描述特征和全局信息预测视频中各事件的起止时间。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。