当前位置 : 首页 > 专利喜报 > 吉林大学;北京理工大学韩嘉懿获国家专利权

吉林大学;北京理工大学韩嘉懿获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉吉林大学;北京理工大学申请的专利基于近端策略优化的智能车辆自主换道决策系统及方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN121543451B 。

龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202610064305.1，技术领域涉及：G06F30/27；该发明授权基于近端策略优化的智能车辆自主换道决策系统及方法是由韩嘉懿;江云川;杨路;宋东鉴;徐文浩;严梓轩;杨鑫设计研发完成，并于2026-01-19向国家知识产权局提交的专利申请。

本基于近端策略优化的智能车辆自主换道决策系统及方法在说明书摘要公布了：基于近端策略优化的智能车辆自主换道决策系统及方法。属于智能交通与自动驾驶技术领域。解决了现有技术在状态空间设计、安全约束建模以及训练策略优化等方面仍存在不足的技术问题。所述系统包括交通仿真环境模块，状态观测与特征构建模块，近端策略优化换道决策模块，奖励计算与安全监督模块，训练控制与数据记录模块以及策略导出与应用模块。基于微观交通仿真平台构建训练环境，通过配置不同车流密度与速度分布，使训练场景更接近真实道路交通，策略在不同工况下具有更好的适应性。

本发明授权基于近端策略优化的智能车辆自主换道决策系统及方法在权利要求书中公布了：1.基于近端策略优化的智能车辆自主换道决策系统，其特征在于，所述系统包括：交通仿真环境模块，状态观测与特征构建模块，近端策略优化换道决策模块，奖励计算与安全监督模块，训练控制与数据记录模块以及策略导出与应用模块；交通仿真环境模块：基于城市交通仿真软件SUMO构建初始化仿真环境与交通流参数，用于提供可控的超车工况；状态观测与特征构建模块：通过交通控制接口在每个仿真时间步从交通仿真环境模块中获取自车及前车的行驶信息，并进行组合和归一化，形成状态向量；近端策略优化换道决策模块：包括策略网络子模块和价值网络子模块，策略网络子模块接收状态向量后，输出“保持车道”和“换道”两种离散动作的概率；价值网络子模块对当前状态的长期回报进行价值估计；对策略网络进行训练时，采用近端策略优化算法进行，并对近端策略优化算法中的裁剪机制进行改进，具体为：首先，根据每个时间步对应的碰撞与安全惩罚项将训练样本划分为普通样本和高风险样本；对于普通样本采用基础裁剪系数，对于高风险样本采用更严格的裁剪系数，且满足，从而近端策略优化算法的剪切目标函数的概率比的裁剪区间根据样本的安全等级在或之间自适应切换，的定义过程具体为：定义第个预测步的车间距离：；其中，为当前自车与前车的实际纵向距离，为当前相对速度，为仿真时间步长，为预测步索引；预测步数上限记为，若存在某个使得，或者当前实际距离本身已经小于，则判定自车存在潜在或现实碰撞风险，则；否则；表示纵向动态安全距离；为碰撞及严重不安全行为的惩罚系数，，，为安全权重系数，，，和分别为空间效率奖励、速度偏差惩罚和横向轨迹偏差惩罚在单步仿真中的绝对值上界；奖励计算与安全监督模块：对每一步仿真结果进行评价，计算复合奖励以及构建随速度变化的动态安全距离，判断未来是否存在碰撞风险，在存在碰撞风险时提前施加惩罚或终止当前回合；复合奖励表示为：；其中，为第个时间步的总奖励；为空间效率奖励；为速度偏差惩罚；为横向轨迹偏差惩罚；为碰撞与安全惩罚；为各部分的权重系数；训练控制与数据记录模块：组织整个强化学习训练流程，形成完整的闭环训练过程；策略导出与应用模块：在训练收敛后，将策略网络参数导出为模型文件，集成到实际应用的仿真平台或硬件在环系统中。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人吉林大学;北京理工大学，其通讯地址为：130012 吉林省长春市前进大街2699号；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

吉林大学;北京理工大学韩嘉懿获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务