南京邮电大学吴瑶获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利交叉口右转车辆与行人交互轨迹的预测方法及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121457756B 。
龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610018140.4,技术领域涉及:G06Q10/04;该发明授权交叉口右转车辆与行人交互轨迹的预测方法及计算机设备是由吴瑶;占志彬;冯浩宸;张学军;周继彪设计研发完成,并于2026-01-08向国家知识产权局提交的专利申请。
本交叉口右转车辆与行人交互轨迹的预测方法及计算机设备在说明书摘要公布了:本发明公开了一种交叉口右转车辆与行人交互轨迹的预测方法及计算机设备,方法包括:获取交叉口右转车辆与行人交互中人‑车历史轨迹和初始状态信息;通过KL正则化改进对抗逆强化学习结构,实现奖励函数与策略的联合学习;利用带有KL约束的NashQ‑learning算法进行联合优化;将优化后的策略模型输入行为仿真器,由初始状态驱动生成的预测轨迹,通过与真实轨迹进行对比,基于指定指标对预测结果进行评估。本发明能够有效提升模型在预测精度、行为一致性与环境泛化能力方面的性能表现,并进一步提升了奖励函数与策略网络的稳定性,增强了模型后续在不同交通场景中的泛化能力,使所学习的策略具备更好的迁移潜力。
本发明授权交叉口右转车辆与行人交互轨迹的预测方法及计算机设备在权利要求书中公布了:1.交叉口右转车辆与行人交互轨迹的预测方法,其特征在于,包括: S1.获取混合交通场景中多个智能体的历史轨迹数据及其初始状态信息,并构建环境编码状态向量; S2.将历史轨迹数据输入最大熵逆强化学习模型,生成轨迹的最大熵概率分布模型,并学习历史轨迹的最优奖励函数; S3.最大熵概率分布模型的最优奖励函数构建KL-AIRL模型,以对策略分布与专家分布间的差异进行约束; S4.KL-AIRL模型中引入多智能体KL约束的NashQ-learning算法,对各智能体策略进行联合优化,以在博弈交互环境中实现策略的稳定收敛与全局最优平衡; S5.将KL-AIRL模型训练得到的策略模型与初始状态输入行为仿真器,依据融合策略进行动作采样,生成预测结果; S6.将预测结果与真实轨迹进行对比,基于指定指标对KL-AIRL模型精准度进行验证; 所述S4步骤中NashQ-learning算法对各智能体策略进行联合优化的具体优化流程包括: 构建多智能体交互的实现公式如下: 其中,表示为当前状态下第个智能体受奖励函数参数影响的多智能体联合动作的评价Q值,为智能体集合,为第个智能体动作的动作空间,为第个智能体的Q函数,定义为在状态下,受奖励参数影响的多智能体局部博弈关系,为奖励参数,为当前状态,为联合动作; 根据当前奖励参数和局部博弈,求解正则化纳什均衡混合策略,其中为智能体执行动作后的下一时刻状态,正则化纳什均衡策略根据当前奖励参数确定,存在满足条件: 其中,表示当其他智能体都采取其最优策略时,智能体所能获得的预期奖励,为智能体在状态和动作下的Q值,为其他智能体的最优策略为智能体的参考策略,为其他智能体在纳什均衡下的最优动作联合,为智能体的候选策略,为正则化系数,表示计算KL散度值; 状态开始的预期累积回报的计算如下所示: 其中,为联合动作的期望,为根据纳什均衡混合策略进行采样操作的动作,为在当前奖励参数下,通过博弈求解得到的各智能体最优策略集合,为智能体的Q值; 之后对于Q值函数,使用Bellman公式更新,更新公式如下: 其中,表示控制更新强度的权重参数,为环境分类分支的权重系数; 最后,根据历史示范轨迹的似然函数,更新奖励参数,有: 其中,为历史示范轨迹集合,用于模型训练的真实专家轨迹数据样本库,为轨迹的概率,表示在当前奖励参数下,观测到特定历史轨迹的可能性,为对参数求偏导,为学习率参数,为控制参数更新步长的超参数; 其中更新如下述方程所示: 其中,为策略间的KL散度平均值,为环境数量,为在环境下的策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210000 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励