天津大学雷建军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种端到端智能视频编码方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115278262B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210915058.3,技术领域涉及:H04N19/21;该发明授权一种端到端智能视频编码方法及装置是由雷建军;靳登朝;彭勃;潘兆庆;李戈设计研发完成,并于2022-08-01向国家知识产权局提交的专利申请。
本一种端到端智能视频编码方法及装置在说明书摘要公布了:本发明公开了一种端到端智能视频编码方法及装置,方法包括:构建一由特征提取模块、全局时域参考特征生成模块、运动估计模块、时域先验编码器、运动补偿模块和重建模块组成的端到端智能视频编码网络框架;所述特征提取模块将当前编码帧映射至特征空间,得到当前编码帧特征;通过全局时域参考特征生成模块获得全局参考特征;通过运动估计模块估计全局参考特征与当前编码帧特征之间的运动矢量;通过时域先验编码器压缩运动矢量;基于压缩的运动矢量和全局参考特征,使用运动补偿模块获得当前编码帧的预测特征;使用时域先验编码器压缩预测特征与当前编码帧特征之间的残差;基于压缩的残差和预测特征生成重建特征,通过重建模块得到最终重建帧。装置包括:处理器和存储器。
本发明授权一种端到端智能视频编码方法及装置在权利要求书中公布了:1.一种端到端智能视频编码方法,其特征在于,所述方法包括: 构建一由特征提取模块、全局时域参考特征生成模块、运动估计模块、时域先验编码器、运动补偿模块和重建模块组成的端到端智能视频编码网络框架; 所述特征提取模块将当前编码帧映射至特征空间,得到当前编码帧特征,通过全局时域参考特征生成模块获得全局参考特征,通过运动估计模块估计全局参考特征与当前编码帧特征之间的运动矢量; 通过时域先验编码器压缩运动矢量,基于压缩的运动矢量和全局参考特征,使用运动补偿模块获得当前编码帧的预测特征,使用时域先验编码器压缩预测特征与当前编码帧特征之间的残差,基于压缩的残差和预测特征生成重建特征,通过重建模块得到最终重建帧; 其中,所述全局时域参考特征生成模块为运动估计模块与运动补偿模块生成全局参考特征ft r,并动态更新一次时域上下文状态信息其中下标t表示当前t时刻,上标li表示第i级上下文状态信息; 所述特征提取模块从参考帧中提取短期时序上下文表示为: 将更新后的时域上下文状态信息通过两层卷积层和级联后,再通过两层卷积进行融合,得到长期时域上下文计算如下: 其中,Fusion·,h0·,h1·,h2·均代表两层卷积层,代表通道维度的级联; 将短期时域上下文和长期时域上下文进行聚合,生成最终的全局时域参考特征ft r: 其中,g·代表一层卷积层; 所述时域先验编码器将运动矢量vt和时域参考信息作为输入,输出压缩后的运动矢量包含:时域上下文生成器、编码器、解码器、和条件熵编解码器; 所述时域上下文生成器用于提取时域参考信息中的多级时域上下文信息{m1,m2,m3},通过级联和卷积操作对来自同一级的频率子带进行聚合,生成多级时域上下文信息{m1,m2,m3}: 其中,g·表示一层卷积层,代表通道维度的级联; 所述编码器将输入的运动矢量vt压缩成紧凑的潜在表示y3,编码器由三个堆叠的编码单元组成,每个编码单元包括:两个残差单元和一个下采样卷积层,将每一个编码单元的输出与时域上下文生成器生成的多级时域上下文信息对应相加,计算公式表示为: 其中,enc·代表编码单元; 所述条件熵编解码器将潜在表示y3进行取整量化,生成量化后的潜在变量使用两个堆叠的编码单元和一层卷积层从时域参考信息中提取时域先验,并使用一层卷积层融合超先验和自回归先验生成空域先验,通过3层1×1卷积融合时域先验和空域先验,获得潜在变量的高斯分布均值μ和方差σ; 通过逆变换解码量化后的潜在变量得到压缩后的运动矢量解码器由三个堆叠的解码单元组成,每个解码单元包括:两个残差单元和一个上采样卷积层; 将每一个解码单元的输出与时域上下文生成器生成的多级时域上下文信息对应相加,最终得到压缩后的运动矢量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。