西北工业大学张帆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于强化学习的柔性约束多智能体系统运动规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116300953B 。
龙图腾网通过国家知识产权局官网在2026-03-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310346192.0,技术领域涉及:G05D1/43;该发明授权一种基于强化学习的柔性约束多智能体系统运动规划方法是由张帆;张鼎禹;黄攀峰;张夷斋;沈刚辉设计研发完成,并于2023-04-03向国家知识产权局提交的专利申请。
本一种基于强化学习的柔性约束多智能体系统运动规划方法在说明书摘要公布了:本发明公开了一种基于强化学习的柔性约束多智能体系统运动规划方法,由以下步骤组成:步骤1:采用离散状态点间欧几里得距离为代价的搜索分别计算得到目标状态到构型空间内各个状态的代价,步骤2:基于目标状态到构型空间内各个离散区间的特征状态的代价设置奖励函数,步骤3:基于Actor‑Critic框架的强化学习算法对系统进行训练,并统计成功率,步骤4:当成功率≥上限阈值,计算奖励函数中优化项的占比,步骤5:当优化项的占比≥时,输出奖励最大的回合经过的状态轨迹;本发明降低了复杂环境下训练使用的数据量,缩减了训练时间,确保了相关指标的优化效果,提高了训练的成功率,提高了算法稳定性。
本发明授权一种基于强化学习的柔性约束多智能体系统运动规划方法在权利要求书中公布了:1.一种基于强化学习的柔性约束多智能体系统运动规划方法,其特征在于,由以下步骤组成: 步骤1:将六自由度刚体运动十二维状态空间以固定尺度离散化,并在离散化的状态空间内选择各个维度的中点作为这一离散化区间的特征状态,以柔性约束多智能体系统的横截条件要求的目标状态为起点,以离散化的状态空间内的各个状态区间的特征点为终点,采用离散状态点间欧几里得距离为代价的搜索分别计算得到目标状态到构型空间内各个状态的代价, 步骤2:基于目标状态到构型空间内各个离散区间的特征状态的代价设置奖励函数, 步骤3:基于Actor-Critic框架的强化学习算法对系统进行训练,并统计N个回合内柔性约束多智能体系统不发生碰撞且到达终点的成功率, 步骤4:当成功率≥上限阈值,且柔性约束多智能体系统未发生碰撞、倾覆、在运动能力限制内时,计算奖励函数中优化项的占比, 步骤5:当优化项的占比≥时,保存Actor网络参数和Critic网络参数,并输出奖励最大的回合经过的状态轨迹; 步骤2中奖励函数表达式为: , 其中,是时刻奖励函数表达式求得的奖励,是回火系数,初始值为0,为导引奖励,为碰撞惩罚奖励,为优化奖励, 其中,所述导引奖励为柔性约束多智能体系统选取某个动作时对应的该动作在构型空间状态表中的负数,所述碰撞惩罚奖励为柔性约束多智能体系碰撞发生时的惩罚值, 其中,所述优化奖励的算法为: , 其中,是时刻系统状态,是系统的决策周期,是HJB方程中的积分性能指标。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励