重庆邮电大学李强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于机器学习的VVC快速帧内编码模式决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119484865B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411643818.5,技术领域涉及:H04N19/593;该发明授权一种基于机器学习的VVC快速帧内编码模式决策方法是由李强;宋衍昭;彭依浪设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本一种基于机器学习的VVC快速帧内编码模式决策方法在说明书摘要公布了:本发明请求保护一种基于机器学习的VVC快速帧内编码模式决策方法,属于视频编码领域,该方法包括以下步骤:获取当前待编码CU的纹理信息、子块纹理信息和领域信息用于LightGBM模型预测;首先使用训练好的LightGBM模型对三个类别的概率进行预测,三个类别分别为:0角度预测模式、1ISP模式、2MIP模式;将概率与阈值进行比较,并且去除概率低于阈值的类别,以减少需执行完整的率失真优化过程的候选模式的数量;此外,在类别0被保留的情况下,进一步使用另一个LightGBM模型预测67种角度预测模式的概率,并去除概率较低的预测模式。本发明在保证视频质量的前提下,能显著节省H.266VVC的帧内编码时间,适用于实时性要求较高的视频编码应用场景。
本发明授权一种基于机器学习的VVC快速帧内编码模式决策方法在权利要求书中公布了:1.一种基于机器学习的VVC快速帧内编码模式决策方法,其特征在于,包括以下步骤: S1、选择用于训练轻量级梯度提升机器LightGBM模型1的CU特征,该模型1实现3个类别即角度预测模式、帧内子块划分ISP模式、基于矩阵的预测MIP模式的概率预测;CU特征包括2个类别的特征,分别是纹理信息和子块纹理信息;纹理信息包括CU的水平和垂直梯度、梯度比值、方差、熵和峰度;子块纹理信息包括:子块方差和子块方差的方差;上下文信息包括:上侧和左侧参考行像素均值; S2、选择用于训练LightGBM模型2的CU特征,该模型2实现角度预测模式中的67种预测方式的概率预测;67种预测方式包括DC、平面和65个不同的角度,CU特征包括3个类别的特征,分别是纹理信息、子块纹理信息和上下文信息; S3、使用修改后的VVC测试参考模型编码器对视频序列进行编码,采集CU的纹理和帧内编码模式数据,建立训练数据集,并对LightGBM模型1、LightGBM模型2进行训练; S4、利用步骤S3已训练好的LightGBM模型1、LightGBM模型2,对CU帧内编码模式进行预测,跳过冗余的CU编码模式的率失真优化RDO过程,实现CU的快速帧内编码模式决策; 所述步骤S3中,LightGBM模型的训练参数设置为:num_leaves=31、learning_rate=0.1、early_stop_rounds=5;其中,num_leaves为每棵子树的最大的叶子数量,用于控制模型的复杂度,较高的值可以提高模型的拟合能力,较低的值可以降低模型的过拟合;learning_rate为模型训练的学习率,用于控制模型的学习速度;early_stop_rounds为模型训练的早停轮数,当模型的损失在指定的回合数训练过程中没有任何变化时,则停止模型的训练过程; 所述步骤S4中,利用已训练好的LightGBM模型,对CU帧内编码模式进行预测,选择最优CU帧内编码模式或跳过冗余的CU帧内编码模式,实现CU的快速帧内编码模式决策的具体过程如下: S41、通过原编码器的粗筛过程获得候选模式列表,进入步骤S42; S42、检查当前待编码CU是否为亮度分量,并且CU尺寸是否满足以下尺寸要求:32×32、32×16、16×32、32×8、8×32、32×16、16×32、16×16、16×8、8×16、8×8;如果满足,进入步骤S43;否则,进入步骤S45; S43、提取当前CU的纹理信息、子块纹理信息作为特征,使用LightGBM模型1预测角度模式、ISP模式和MIP模式三个类别的概率;分别将三个类别的概率与阈值进行比较,如果小于阈值,则去除候选模式列表中对应类别的模式;否则,保留对应类别的模式,进入步骤S44; S44、如果角度模式类别的概率大于阈值,则提取当前CU的纹理信息、子块纹理信息和上下文纹理信息作为特征,使用LightGBM模型2预测67种角度预测模式的概率;并且将S41步骤中获取的候选模式列表中的角度模式与概率进行比较,仅保留其中位于Top-3的模式,进入步骤S45; S45、使用原编码器的完整的率失真优化过程计算候选模式列表中的每一个模式的率失真代价,并且选择其中率失真代价最低的一个模式作为最优的帧内编码模式,进入步骤S46; S46、结束当前CU的帧内编码模式搜索过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励