厦门大学雷中岳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门大学申请的专利一种应用于混合语境中的多码率深度图像压缩系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115866266B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211533806.8,技术领域涉及:H04N19/192;该发明授权一种应用于混合语境中的多码率深度图像压缩系统及方法是由雷中岳;洪学敏;陈凌宇;石江宏设计研发完成,并于2022-12-01向国家知识产权局提交的专利申请。
本一种应用于混合语境中的多码率深度图像压缩系统及方法在说明书摘要公布了:本发明涉及一种应用于混合语境中基于掩码的多码率深度图像压缩系统及方法,其中,系统包括深度图像编解码模块、潜在向量重要性分析模块和隐空间编码模块。本发明采用单一深度编解码模型实现多码率和混合语境自适应,相对于当前训练多个模型的进行码率和语境自适应的方法,节省了大量的存储和通信资源;而且,本发明进行图像压缩编码时,深度编码器进行一次编码得到潜在向量,通过隐空间编码实现码率和语境自适应,使得图像的压缩传输具有更高的实时性。
本发明授权一种应用于混合语境中的多码率深度图像压缩系统及方法在权利要求书中公布了:1.一种应用于混合语境中基于掩码的多码率深度图像压缩系统,其特征在于:所述系统包括深度图像编解码模块、潜在向量重要性分析模块和隐空间编码模块; 所述深度图像编解码模块包括深度编码器、量化器、熵编码器、熵解码器和深度解码器;其中,深度编码器和深度解码器由训练收敛的深度卷积神经网络构成,卷积神经网络的参数采用端到端方式进行训练所得; 所述深度编码器,用于输入原图像,生成隐空间潜在向量; 所述量化器,用于输入隐空间编码模块输出的待发送向量,并对待发送向量的每个元素进行标量量化处理; 所述熵编码器,用于输入量化后的潜在向量,并对量化后的潜在向量进行熵编码生成最终发送的码流,该码流经信道发送至熵解码器; 所述熵解码器,用于接收码流,对码流进行熵解码,并重建潜在向量; 所述深度解码器,用于输入熵解码器重建的潜在向量,并进行图像重建,输出原图像的重建图像; 所述潜在向量重要性分析模块包括语义重要性分析单元、重建重要性分析单元和重要性映射图融合单元; 所述语义重要性分析单元,用于输入原图像,并分析原图像的每个像素对图像分类结果的重要性程度并映射到隐空间潜在向量的每个平面位置,生成隐空间潜在向量语义重要性映射图; 重建重要性分析单元,用于输入潜在向量,并分析潜在向量每个平面位置对图像重建的重要性大小,生成隐空间潜在向量的重建重要性映射图; 重要性映射图融合单元,用于输入潜在向量的语义重要性映射图和重建重要性映射图,生成混合语境下的潜在向量重要性映射图; 隐空间编码模块包括隐空间掩码生成单元和编码单元; 隐空间掩码生成单元,用于输入信道反馈的目标码率和潜在向量重要性映射图,计算当前信道资源下允许传送最大潜在向量的元素个数,然后计算潜在向量重要性映射图二值化的阈值,并把重要性映射图二值化为隐空间掩码向量; 编码单元,用于输入潜在向量和隐空间掩码向量,根据隐空间掩码向量从潜在向量中选择元素,并将所选择的元素与掩码拼接形成待发送向量; 所述深度编码器和深度解码器采用端到端方式进行迭代训练,训练过程的目标函数为: (1) 其中,E,D表示深度编码器和解码器,为潜在向量的码率,为语义特征匹配损失项,为重建损失项; 其中,x、y为原图和重建图像,H、W、3为x、y的维度,为语义特征提取函数,分别为语义特征向量的维度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门大学,其通讯地址为:361000 福建省厦门市思明区思明南路422号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。