Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 长春工业大学李绍松获国家专利权

长春工业大学李绍松获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉长春工业大学申请的专利强化学习与博弈论融合的人机动态协同转向控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120630727B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511087884.3,技术领域涉及:G05B13/04;该发明授权强化学习与博弈论融合的人机动态协同转向控制方法是由李绍松;裴晓雷;龙哲;田丽媛;李德涛;麦高逢;王德鑫;崔高健;卢晓晖设计研发完成,并于2025-08-05向国家知识产权局提交的专利申请。

强化学习与博弈论融合的人机动态协同转向控制方法在说明书摘要公布了:强化学习与博弈论融合的人机动态协同转向控制方法,旨在优化驾驶员与控制器的动态权重分配,以保障人机共驾车辆行驶的安全性与路径跟踪精度。本发明涉及智能驾驶领域。本发明包括期望路径模块、强化学习模块、非合作博弈模块和人机共驾车辆四个模块。期望路径模块用于生成驾驶员与控制器期望路径序列以及当前时刻期望路径;强化学习模块接收当前时刻期望路径、车辆动态信息、驾驶员与控制器最优转角,训练生成驾驶员控制权重;非合作博弈模块结合驾驶员控制权重、驾驶员与控制器期望路径序列和自车状态信息,通过非合作博弈优化出驾驶员与控制器最优转角,实现对人机共驾车辆的协同转向控制。

本发明授权强化学习与博弈论融合的人机动态协同转向控制方法在权利要求书中公布了:1.强化学习与博弈论融合的人机动态协同转向控制方法,其特征在于:该方法通过期望路径模块、强化学习模块、非合作博弈模块和人机共驾车辆四个模块构成闭环控制系统,实现对人机共驾车辆的协同转向控制;其中,期望路径模块生成驾驶员与控制器期望路径序列以及当前时刻期望路径;强化学习模块接收当前时刻期望路径、车辆动态信息、驾驶员与控制器最优转角,通过信息预处理将接收信息转换为强化学习状态空间,再通过强化学习训练生成驾驶员控制权重;非合作博弈模块结合驾驶员控制权重、驾驶员与控制器期望路径序列和自车状态信息,通过预测模型建立、目标函数设计、纳什均衡求解三个步骤得出驾驶员与控制器最优转角,实现对人机共驾车辆的协同转向控制; 所述期望路径模块用于生成驾驶员与控制器期望路径序列以及当前时刻期望路径其中Rdm和分别为驾驶员模型生成的驾驶员期望路径序列和驾驶员期望横摆角序列,Rc和分别为控制器期望路径序列和控制器期望横摆角序列,Rdm1和分别为当前时刻的驾驶员期望路径和驾驶员期望横摆角,Rc1和分别为当前时刻的控制器期望路径和控制器期望横摆角; 所述强化学习模块首先获取当前时刻期望路径Rt,车辆动态信息以及驾驶员与控制器最优转角和其中,x和y分别为自车的纵向和侧向位置,vx为自车的纵向速度,为自车的横摆角,β为自车的质心侧偏角,ay为自车的侧向加速度,xf为前车的纵向位置,vxf为前车的纵向速度; 通过所述信息预处理将当前时刻期望路径Rt、车辆动态信息Ct、驾驶员与控制器最优转角和转换为强化学习状态空间其中,为驾驶员侧向位移误差,为驾驶员横摆角误差,为控制器侧向位移误差,为控制器横摆角误差,DTC为自车与前车的碰撞距离,TTC为自车与前车的碰撞时间,W为驾驶员权重变化速率,eδ为驾驶员最优转角与控制器最优转角的偏差,wd为驾驶员控制权重; 本发明基于安全性、舒适性、跟踪精度和人机误差四个方面进行强化学习模块的奖励函数设计;其中,安全性考虑驾驶风险和行驶稳定性,舒适性考虑自车侧向加速度和驾驶员权重变化速率,跟踪精度考虑驾驶员与控制器的路径跟踪误差,人机冲突考虑驾驶员最优转角与控制器最优转角的偏差,如下述公式所示: Rtotal=τ1Rrisk+τ2Rstab+τ3Rlat+τ4Rrate+τ5Rerror+τ6Rconf, Rstab=2·-tanh2k3·β+0.5, 其中,Rtotal为强化学习的总奖励函数,Rrisk为驾驶风险奖励函数,Rstab为行驶稳定性奖励函数,Rlat为自车侧向加速度奖励函数,Rrate为驾驶员权重变化速率奖励函数,Rerror为路径跟踪误差奖励函数,Rconf为人机冲突奖励函数,DTCthreshold和TTCthreshold分别为自车与前车的碰撞距离阈值和碰撞时间阈值,n为归一化常数,τi为各项奖励函数的权重,σi为惩罚幅度,ki和li分别为斜率调节参数和与阈值变化调节参数,其中i={1,2,…,6},tanh表征双曲正切函数; 根据所述强化学习的总奖励函数进行强化学习训练,输出驾驶员控制权重wd; 所述非合作博弈模块接收驾驶员控制权重wd、驾驶员与控制器期望路径序列Rs、自车状态信息进行驾驶员与控制器的非合作博弈;其中,vy为自车侧向速度,ω为自车的横摆角速度; 所述驾驶员与控制器的非合作博弈第一步为预测模型建立,具体如下述公式所示: Zk=Ψξk+ΘdUdk+ΘcUck, 其中,Z为控制输出矩阵,为状态变量,Ud和Uc分别为驾驶员与控制器的控制输入矩阵,Ψ为状态变量系数矩阵,Θd和Θc分别为驾驶员与控制器的控制输入系数矩阵,k为当前时刻; 所述驾驶员与控制器的非合作博弈第二步为目标函数设计,具体如下述公式所示: 其中,Vd和Vc分别为驾驶员与控制器的目标函数,Qd和Qc分别为驾驶员与控制器的路径跟踪权重,Pd和Pc分别为驾驶员与控制器的转角权重;所述强化学习模块训练出的驾驶员控制权重wd即为驾驶员路径跟踪权重Qd,具体如下述公式所示: 所述驾驶员与控制器的非合作博弈第三步为纳什均衡求解,运用最小二乘法和凸迭代法求出驾驶员与控制器的最优转角序列和选取每个序列的第一个元素分别作为驾驶员最优转角和控制器最优转角,用于传递给强化学习模块和人机共驾车辆,具体如下述公式所示: 其中,和分别为驾驶员与控制器最优转角; 所述人机共驾车辆接收上述驾驶员与控制器最优转角和然后将两者相加得到人机共驾车辆的控制转角δf,实现对人机共驾车辆即自车的协同转向控制。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春工业大学,其通讯地址为:130012 吉林省长春市朝阳区延安大街2055号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。