浙江工业大学华夏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利基于双流信息瓶颈的深度强化学习行动者-评价者网络结构的车辆路径跟踪控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119596920B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411431604.1,技术领域涉及:G05D1/43;该发明授权基于双流信息瓶颈的深度强化学习行动者-评价者网络结构的车辆路径跟踪控制方法是由华夏;张腾腾;程相乐设计研发完成,并于2024-10-14向国家知识产权局提交的专利申请。
本基于双流信息瓶颈的深度强化学习行动者-评价者网络结构的车辆路径跟踪控制方法在说明书摘要公布了:基于双流信息瓶颈的深度强化学习行动者‑评价者网络结构及对四轮独立转向独立驱动车辆的路径跟踪控制方法,包括:在Critic网络中,在Q值估计之前加入已知信息瓶颈模块,从中提取已知类信息,并设计训练目标以最小化时间差分误差、最小化互信息、并约束参数范数;在Actor网络中,在策略生成模块之前加入未知信息瓶颈模块,从中提取未知类信息,并设计训练目标以最大化期望累积奖励、最大化互信息、最小化条件熵;在训练过程中,将样本中的状态和动作输入Critic网络和互信息估计器网络,得到Q值估计和互信息估计,并通过最小化目标函数更新Critic网络参数;通过策略梯度定理和重要性采样来更新Actor网络参数,以最大化目标函数;同时,独立训练互信息估计器网络,通过采样和优化实现对互信息的最大化估计;为了实现动态调节,设置权重调度器,根据当前训练轮数和平均回报,动态调整Actor和Critic目标函数中的系数,并使用线性衰减策略进行调节。
本发明授权基于双流信息瓶颈的深度强化学习行动者-评价者网络结构的车辆路径跟踪控制方法在权利要求书中公布了:1.基于双流信息瓶颈的深度强化学习行动者-评论者架构的车辆路径跟踪控制方法,使用信息瓶颈IB去除样本中的冗余信息,提取数据中的高维特征,减少泛化错误;为了缓解IB导致深度强化学习DRL对已知数据的过度拟合,反向信息瓶颈RIB反转IB的优化目标,生成具有判别力的未知环境特征信息,提高DRL控制器的泛化能力;具体实施步骤包括: 步骤1,建立四轮转向车辆动力学模型; 步骤2,车辆的运动控制过程直接使用MDP形式: 步骤3,选择TD3算法实现DRL部分; 步骤4,DRL通过车辆状态映射的动作传递给车辆,更新车辆状态并再次传递给DRL。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励