Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中山大学·深圳;中山大学王帅获国家专利权

中山大学·深圳;中山大学王帅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中山大学·深圳;中山大学申请的专利一种基于异步深度强化学习的无信号交叉口车辆协作方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119445835B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411502421.4,技术领域涉及:G08G1/01;该发明授权一种基于异步深度强化学习的无信号交叉口车辆协作方法是由王帅;丁宇豪设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。

一种基于异步深度强化学习的无信号交叉口车辆协作方法在说明书摘要公布了:本发明公开了一种基于异步深度强化学习的无信号交叉口车辆协作方法,方法包括:通过制定马尔可夫决策框架来描述车辆在交叉口区域的协同问题,所述系统问题包括观测状态空间、动作空间和奖励函数;基于共享深度神经网络架构设计车辆协作模型,所述共享深度神经网络架构设计的内容包括控制输出策略与值函数估计策略;使用异步训练策略对所述车辆协作模型进行训练;根据训练完成后的所述车辆协作模型对实际场景中的车辆信息进行处理,输出无信号交叉口的车辆协作方案。本发明实施例可在有限的计算资源内,实现车辆在无信号交叉口场景的有效协作,减少车辆堵塞和冲突,提升交通管理的安全性与通行效率,可广泛应用于智能交通技术领域。

本发明授权一种基于异步深度强化学习的无信号交叉口车辆协作方法在权利要求书中公布了:1.一种基于异步深度强化学习的无信号交叉口车辆协作方法,其特征在于,包括以下步骤: 制定马尔可夫决策框架来描述车辆在交叉口区域的协同问题,所述协同问题包括观测状态空间、动作空间和奖励函数; 基于共享深度神经网络架构设计车辆协作模型,所述共享深度神经网络架构设计的内容包括控制输出策略与值函数估计策略; 使用异步训练策略对所述车辆协作模型进行训练; 根据训练完成后的所述车辆协作模型对实际场景中的车辆信息进行处理,输出无信号交叉口的车辆协作方案; 所述制定马尔可夫决策框架来描述车辆在交叉口区域的协同问题,包括以下步骤: 根据所有车辆的状态空间串联得到状态空间,其中,对于每辆车的状态,使用公式表示,其中,表示车辆在交叉口场景的横纵坐标,表示车辆即时速度在横纵坐标轴上的投影速度,作为车辆的意图表示; 根据纯跟踪算法计算得到车辆的转向角,进而确定车辆的横向动作;并根据车辆的加速度确定纵向动作,根据所有车辆的纵向动作串联得到车辆的动作空间; 当车辆执行动作使得状态值发生转换后,根据奖励函数确定对应的奖励值;所述奖励值由碰撞奖励、时间步长奖励和成功奖励组成;其中,所述碰撞奖励用于当车辆发生碰撞时给予数值为-100的碰撞奖励,否则为0;所述时间步长奖励根据当前模拟环境累积的时间步长的负值确定;所述成功奖励用于当所有车辆都成功不碰撞地通过交叉口时,给予数值为100的成功奖励,否则为0; 所述制定马尔可夫决策框架来描述车辆在交叉口区域的协同问题,还包括以下步骤: 当环境处于状态值时,车辆执行动作A,它们的下一时刻状态将由车辆运动学方程计算得出,计算公式为:,其中,和表示车辆位置坐标,和表示车辆的车身角和速度,和表示车辆的转向角和加速度,表示车辆的纵向轴长,和表示下一时刻状态的车辆位置坐标,和表示下一时刻状态的车辆的车身角和速度; 通过奖励折现因子计算动作序列的累积奖励。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学·深圳;中山大学,其通讯地址为:518107 广东省深圳市光明新区公常路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。