吉林大学周户星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉林大学申请的专利基于深度逆强化学习的汇入区域主路车驾驶行为建模方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120316454B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510805963.7,技术领域涉及:G06F18/20;该发明授权基于深度逆强化学习的汇入区域主路车驾驶行为建模方法是由周户星;崔云龙;孙宝凤;李迟;许杨;梁宏朝;马国栋设计研发完成,并于2025-06-17向国家知识产权局提交的专利申请。
本基于深度逆强化学习的汇入区域主路车驾驶行为建模方法在说明书摘要公布了:本发明涉及一种基于深度逆强化学习的汇入区域主路车驾驶行为建模方法,该方法构建主路车专家轨迹集;构建仿真环境模型,环境模型的输入包括由主路车专家轨迹集D提供的当前状态特征和由PPO算法中主路车策略网络控制主路车提供的动作特征;状态转移函数用于根据当前状态特征和动作特征,返回下一时间步的状态特征;奖励网络用于根据主路车的状态特征给出每一时间步的瞬时奖励;构建由最大熵深度逆强化学习算法和PPO算法构成的框架;之后进行训练,使用PPO算法训练以生成主路车在仿真环境下的预测轨迹;将预测轨迹与主路车专家轨迹输入最大熵深度逆强化学习算法,计算损失函数,更新奖励网络参数,直到收敛,解决传统单一方法存在的策略失准问题。
本发明授权基于深度逆强化学习的汇入区域主路车驾驶行为建模方法在权利要求书中公布了:1.一种基于深度逆强化学习的汇入区域主路车驾驶行为建模方法,其特征在于,该方法包括以下步骤: 步骤A.构建汇入区域自动驾驶车辆轨迹数据集U,所述自动驾驶车辆轨迹数据集U包含:汇入区域内每时间步的所有车辆属性信息,位置,横纵向速度,横纵向加速度和与lanelet2格式高精地图相关数据;将自动驾驶车辆轨迹数据集U进行预处理,形成主路车专家轨迹集D; 步骤B.构建可供训练的仿真环境模型,所述仿真环境模型的输入包括由主路车专家轨迹集D提供的当前状态特征和由PPO算法中主路车策略网络控制主路车提供的动作特征;仿真环境模型内的状态转移函数用于根据当前状态特征和动作特征,返回下一时间步的状态特征;奖励网络用于根据主路车的状态特征给出每一时间步的瞬时奖励; 步骤C.构建由最大熵深度逆强化学习算法和强化学习算法构成的最大熵深度逆强化学习框架,所述强化学习算法采用PPO算法,奖励网络作为最大熵深度逆强化学习算法的一部分; 步骤D.训练: 初始化奖励网络和PPO算法的网络参数;使用PPO算法训练以生成主路车在仿真环境下的预测轨迹,直至收敛;将预测轨迹与主路车专家轨迹输入最大熵深度逆强化学习算法,计算损失函数,反向传播更新奖励网络参数,直到收敛。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130012 吉林省长春市南关区人民大街5988号吉林大学南岭校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。