山东大学王鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利一种基于GRPO强化学习的神经网络自动化剪枝方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121052319B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511596004.5,技术领域涉及:G06N3/082;该发明授权一种基于GRPO强化学习的神经网络自动化剪枝方法是由王鹏;徐梦尧;赵浩然;张梦莹;吕佳瑞;丁晨;刘天成设计研发完成,并于2025-11-04向国家知识产权局提交的专利申请。
本一种基于GRPO强化学习的神经网络自动化剪枝方法在说明书摘要公布了:本发明属于人工智能技术领域,具体涉及一种基于GRPO强化学习的神经网络自动化剪枝方法,包括在待剪枝神经网络的批量归一化层中引入动态缩放因子,并结合注意力机制计算待剪枝神经网络各卷积层通道的重要性评分;基于步骤S1的重要性计算结果,构建包含层结构特征的多维状态向量;将S2中构建的多维状态向量输入至GRPO强化学习代理的策略网络,由该策略网络根据当前网络层的状态信息生成剪枝动作,同时定义该动作表示该层的剪枝率;本方法采用GRPO强化学习算法,舍弃了传统的Critic模型,通过“组采样‑相对优势估计”机制简化策略计算过程,显著降低了内存占用。
本发明授权一种基于GRPO强化学习的神经网络自动化剪枝方法在权利要求书中公布了:1.一种基于GRPO强化学习的神经网络自动化剪枝方法,其特征在于,包括: S1、在待剪枝神经网络的批量归一化层中引入动态缩放因子,并结合注意力机制计算待剪枝神经网络各卷积层通道的重要性评分; S2、基于步骤S1的重要性评分,构建包含层结构特征的多维状态向量; S3、将多维状态向量输入至GRPO强化学习代理的策略网络,由该策略网络根据当前网络层的状态信息生成剪枝动作,同时基于剪枝动作设置该层的剪枝率; S4、根据S3中GRPO策略网络输出的每层剪枝率结合S1中计算得到的通道重要性评分,按重要性从低到高排序,剪除相应比例的冗余通道;完成当前层剪枝后,更新网络结构状态,并将处理流程递进至下一层,直至遍历全部待剪枝层; S5、对S4中完成剪枝的轻量化神经网络进行参数调整,并使用验证集计算剪枝后轻量化神经网络的精度Acc以及剪枝前后神经网络的浮点运算量FLOPs变化;基于精度Acc以及根据浮点运算量FLOPs评估剪枝效果,并将剪枝效果反馈至S3中的GRPO策略代理,用于下一轮策略迭代优化; 该方法还包括将剪枝后轻量化神经网络转换为TensorRT格式,并部署至边缘设备执行推理任务,其方法具体包括: S61、对步骤S5中经优化验证后的剪枝后轻量化神经网络进行格式预处理,先将该神经网络从原始训练框架格式导出为ONNX通用格式,导出过程中固定神经网络输入维度、算子类型及权重参数; S62、启动NVIDIAJetsonXavierNX边缘设备上的TensorRTSDK工具,加载步骤S61导出的ONNX格式神经网络,通过TensorRT的模型解析器解析神经网络计算图,自动完成算子融合、精度校准及内存优化,生成适配边缘设备硬件架构的TensorRT引擎文件; S63、配置边缘设备的运行环境,安装与TensorRT引擎匹配的CUDAToolkit、cuDNN库及PythonC++推理依赖包,将步骤S62生成的TensorRT引擎文件加载至边缘设备内存。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250100 山东省济南市历下区经十路17923号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励