江苏大学蔡英凤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏大学申请的专利融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116027788B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310026965.7,技术领域涉及:G05D1/43;该发明授权融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法及设备是由蔡英凤;付新科;滕成龙;陈龙;王海;刘擎超;孙晓强设计研发完成,并于2023-01-09向国家知识产权局提交的专利申请。
本融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法及设备在说明书摘要公布了:本发明公开了融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法及设备,通过引入部分可观察马尔可夫决策过程POMDP,提供了一种在不确定性环境下,多智能体交互的理想决策模型,随着模型维度的增加,其计算复杂度也大大增加,为解决计算复杂度问题,本发明引入基于复杂网络认知理论对驾驶环境进行建模,用于评估重要节点并提取风险树,以缩小POMDP模型的置信空间、加速模型求解,从而实现在高度交互的动态不确定性驾驶环境下进行实时性的行为决策,相比于采用有限状态机和RL的行为决策方法,本发明在保证算法可解释性的同时,可在高度交互的动态不确定性驾驶环境中有效运行,为高级别的智能驾驶系统开发提供了新的解决思路。
本发明授权融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法及设备在权利要求书中公布了:1.融合复杂网络理论和部分可观察马尔可夫决策过程的智能驾驶行为决策方法,其特征在于,包括如下步骤: 步骤1:应用基于复杂网络的认知理论对驾驶环境进行动态建模; 步骤2:根据人类驾驶员对距离的敏感度和反应时间,将节点周围分为第一认知域、第二认知域和域外空间; 步骤3:根据步骤1动态建模所得的模型,生成复杂网络并评估重要节点和提取风险树; 步骤4:应用POMD理论对自车决策过程进行建模,消除驾驶环境中的不确定性; 所述步骤4具体包括: 步骤4.1:设εt表示时间t时刻以自车为中心的驾驶环境,包括前面步骤中建模的认知模型、交通信号、静态障碍占用的栅格地图等;表示车辆i∈V在时间t时刻的状态,当i=0时表示自车,状态量缺少上标时表示所有车辆,缺少下标时表示所有时间点;自车接受到的观测值记为zt,并使用观测值去评估真实的状态量xt;则行为决策的输入记为zt,εt,输出为一组连续的离散状态参数,记为其中H表示一个规划周期的时间长度; 步骤4.2:POMDP模型定义为一组六元素X,A,Z,T,O,R,其中,X、A和Z分别为状态空间、行为空间和观测空间;T为连续时刻的状态概率转移函数Txt‑1,at,xt=pxt|xt‑1,at,O为状态量与观测量之间的概率函数Oxt,zt=pzt|xt,通过将状态量和观测值用概率分布的形式来表示,用以反映驾驶环境中的不确定性,Rxt‑1,at为奖励函数,表示自车在状态xt‑1∈X采取行为at∈A后获得的实时奖励; 当自车处于真实的驾驶场景中时,状态空间可以表示为其中N为交通参与者的数量,t为当前时刻,车辆的状态量包括位姿信息、复杂网络模型中构建的节点强度以及无法直接观测到的车辆隐藏状态; 则T可以表示为将自车与其他交通参与者区分开来,并假设其状态的转化是瞬时过度的,则T可以进一步转化为: 其中,为假设的驾驶员模型,反映了其他交通参与者的上层的决策过程; 为其他交通参与者的状态概率转移模型,反映了其他交通参与者执行决策的运动学过程,为简化模型的求解,将其设为运动点模型; 为了消除不确定性,POMDP模型在置信空间上进行决策,其为状态X的概率分布,置信空间的置信度将在交通参与者采取行为at并接收到观测量zt后,从初始置信bt‑1进行更新,采用贝叶斯公式进行置信度的更新: 其中,η为归一化因子,其他车辆的观测值可以由自车的感知和预测模块得到,则有: 假设观测过程是相互独立的,则置信更新过程进一步写为: 由上式可以看出,尽管每个交通参与者的状态转移过程是相互独立的,但和中使用了所有交通参与者的状态量和观测值,因此使置信更新过程成为一个交互的过程,从而在置信更新过程中逐步更新其他交通参与者的隐藏状态; 在POMDP模型中,决策的目的是在置信空间上找到一个最佳决策策略π*,使自车在规划周期采取一系列离散行为后,获得最大的奖励期望,则有: 其中,t0为当前规划的起始时间;γ为奖励R的折扣系数,取0≤γ≤1;为初始置信,从起始时间和初始置信开始,在规划周期tH内,逐步扩展行为空间A和观测空间O,并逐步在置信空间中生成置信树的节点,通过对各个节点使用Bellman方程,可以找到最优策略: 其中,为置信度的最优效用函数;Q*b,a为在置信空间中采取某个行为后所能获得的最优值,则可以通过置信树寻找每个节点对应的最优策略所对应的行为和观测值: 采取以上步骤可以得到每个节点最优策略所对应的状态量,包括置信度、采取的行为和观测值,即对于令即可得到最终的决策策略步骤5:根据步骤4所建模型,进行自车的行为决策。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏大学,其通讯地址为:212013 江苏省镇江市京口区学府路301号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励