Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华南理工大学张丽娟获国家专利权

华南理工大学张丽娟获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华南理工大学申请的专利一种基于Rainbow DQN强化学习的路面养护决策方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118212103B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410155939.9,技术领域涉及:G06Q50/26;该发明授权一种基于Rainbow DQN强化学习的路面养护决策方法是由张丽娟;甄宏彬;关宏磊;储鑫;徐劭枫;陈柏同设计研发完成,并于2024-02-04向国家知识产权局提交的专利申请。

一种基于Rainbow DQN强化学习的路面养护决策方法在说明书摘要公布了:本发明公开了一种基于RainbowDQN强化学习的路面养护决策方法,具体包括:S1、采集路面性能历史数据及影响路面性能的参量;S2、根据步骤S1的数据构建基于LSTM神经网络的路面使用性能预测模型;S3、根据步骤S1的数据及步骤S2的预测结果,构建基于RainbowDQN强化学习的路面养护决策模型;S4、设置预测年限,输入对应步长的路面性能历史数据、影响路面性能的参量,通过路面使用性能预测模型及路面养护决策模型,输出得到预测年限内路面的养护动作及对应的综合效益费用比;S5、选择最大的综合效益费用比对应的养护动作作为最终的路面养护方案。本发明实现路面养护决策方法的智能化,提高路面养护的综合效益比。

本发明授权一种基于Rainbow DQN强化学习的路面养护决策方法在权利要求书中公布了:1.一种基于RainbowDQN强化学习的路面养护决策方法,其特征在于,包括步骤: S1、采集路面性能历史数据及影响路面性能的参量; S2、通过所述路面性能历史数据及影响路面性能的参量对LSTM神经网络进行训练及优化,构建基于LSTM神经网络的路面使用性能预测模型; S3、根据所述路面性能历史数据、影响路面性能的参量及LSTM路面使用性能预测模型得到的预测结果,构建基于RainbowDQN强化学习的路面养护决策模型; S4、设置预测年限,输入对应步长的路面性能历史数据、影响路面性能的参量,通过路面使用性能预测模型得到预测结果,将路面性能历史数据、影响路面性能的参量及所述预测结果输入所述路面养护决策模型,输出得到预测年限内路面的养护动作及对应的综合效益费用比; S5、根据预测年限内路面的养护动作及对应的综合效益费用比,选择最大的综合效益费用比对应的养护动作作为最终的路面养护方案; 步骤S3具体包括: S31、确定RainbowDQN模型中各个元素的定义,元素包括:智能体Agent、状态State、回报Reward、环境Environment和动作Action; S32、确定RainbowDQN模型的输入参数,所述输入参数包括路面性能历史数据、影响路面性能的参量及路面使用性能预测模型得到的预测结果,将输入参数预处理后分为训练集及测试集,Q分布作为输出参数,输出参数的个数等于养护动作的数量; S33、使用Keras库中的Sequential模型构建块状模型,依次添加卷积层、全连接层和输出层,并对块状模型进行编译,指定损失函数和优化器,使用所述训练集训练RainbowDQN模型,再使用所述测试集进行验证,得到训练后的RainbowDQN模型,利用误差分析方法对训练后的RainbowDQN模型的预测结果进行分析,误差分析完成后即得到基于RainbowDQN强化学习的养护决策模型, 其中,RainbowDQN模型综合运用多种DQN改进算法来提高强化学习的性能,具体包括:优先级经验回放方法PrioritizedReplayBuffer用于存储智能体与环境交互的经验,根据样本的重要性进行抽样,更关注对学习有帮助的样本;每个养护动作的Q值,由状态价值函数V和优势函数H确定,同时引入目标网络TargetQ-network定期更新主网络的参数,以稳定训练过程;通过双深度Q网络方法DoubleDQN,使用两个独立的神经网络进行决策及评估,以减少估计偏差;多步学习方法Multi-Step用以更准确地估计长期回报;值分布DQN方法DistributionalDQN使用多个智能体并行地与环境交互;采用NoisyNet中的噪音参数以加速学习和策略探索。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。