Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 吉林大学黄殷梓获国家专利权

吉林大学黄殷梓获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉吉林大学申请的专利一种基于强化学习的智能汽车雨雾测试场景生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120874982B

龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511403595.X,技术领域涉及:G06N5/01;该发明授权一种基于强化学习的智能汽车雨雾测试场景生成方法是由黄殷梓;朱冰;赵健;张培兴;高质桐;李文旭设计研发完成,并于2025-09-29向国家知识产权局提交的专利申请。

一种基于强化学习的智能汽车雨雾测试场景生成方法在说明书摘要公布了:本发明涉及一种智能汽车测试场景生成方法,特别涉及一种基于强化学习的智能汽车雨雾测试场景生成方法,步骤包括:测试场景建模、引入价值函数、设置奖励函数、扩散正余弦Q学习。本发明引入连续风险势场奖励重塑方法描述智能汽车在雨雾环境中的连续奖励过程;设计衰减贪心策略提高场景生成方向的随机性;并通过使用正余弦算法对Q‑learning进行初始化,同时增加扩张正余弦算法过程作为逆向课程生成,扩散正余弦Q学习算法在不增加SCA迭代总次数的条件下,通过调整各SCA模块参数使其关注范围逐步扩张并更新Q值作为强化学习的逆向课程,进一步加速测试场景生成算法整体的迭代收敛速度。

本发明授权一种基于强化学习的智能汽车雨雾测试场景生成方法在权利要求书中公布了:1.一种基于强化学习的智能汽车雨雾测试场景生成方法,其特征在于:包括以下步骤: 步骤1、测试场景建模:建模为一个由测试场景中可能的车辆的运动状态集合、测试场景中可选的车辆的动作集合、状态转移概率函数、奖励函数和奖励折扣因子五元组定义的随机过程; 步骤2、引入价值函数:在强化学习基础上,针对给定强化学习策略,引入状态价值函数和动作价值函数;通过时序差分算法对价值进行单步修正; 步骤3、设置奖励函数:在测试场景生成中,结合基于风险场的奖励函数设置方法获得奖励函数;基于风险场的奖励函数设置方法为: 构建由环境风险场组成的奖励函数,该奖励函数作为即时奖励部分被引入强化学习过程,具体表达式为: ; 式中,代表由于雨雾气象导致的风险场恶化程度,通过降雨强度或雾气能见度进行建模;是指车辆运动形成的运动风险场;是指静态道路形成的道路风险场,两者的具体表达式为: ; ; 式中,代表主车EV和周围交通车辆BV之间的真实距离;为车辆运动的速度;代表道路条件系数;代表目标物体的虚拟质量;代表道路线型的重要性,单实线的取值大于点划线的取值;代表EV中轴线与车道线之间的横向距离;为定值,决定当EV靠近车道线时安全风险提升的速度; 步骤4、扩散正余弦Q学习:强化学习算法通过引入Q值来刻画智能体在每个状态下执行各动作所能获得的预期回报,并不断更新Q值表;完成测试场景生成的训练后,智能体在任意状态下根据Q值选择能够最大化长期累积回报的最优动作; 在标准强化学习框架中引入扩散正余弦过程,扩散正余弦过程由若干参数各异的正余弦算法SCA模块按序组合而成; 扩散正余弦Q学习分为三个阶段:初始SCA阶段、扩张SCA阶段、Q-learning阶段;扩张SCA阶段动态调整各SCA个体的参数,使用SCA个体的迭代对种群个体进行迭代,对每个个体进行动作选择、采取动作然后观察状态和奖励并更新Q值作为逆向课程生成;重复上述过程直到当前SCA模块的迭代次数达到设定的最大迭代次数,所有SCA模块均执行完成则扩散正余弦过程结束。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉林大学,其通讯地址为:130012 吉林省长春市前进大街2699号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。