深圳技术大学刘小旭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳技术大学申请的专利一种多智能体编队避障方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119690132B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411763161.6,技术领域涉及:G05D1/695;该发明授权一种多智能体编队避障方法、装置及存储介质是由刘小旭;姚晨昊;袁梓柯设计研发完成,并于2024-12-03向国家知识产权局提交的专利申请。
本一种多智能体编队避障方法、装置及存储介质在说明书摘要公布了:本发明涉及自动避障技术领域,公开了一种多智能体编队避障方法、装置及存储介质,其中方法包括如下步骤:S100:构建动作价值网络模型和训练环境模型,利用训练环境模型对动作价值网络模型进行训练,获得多智能体编队避障的动作价值网络模型,每个轮次的训练过程中随机设置动态障碍物的坐标和智能体队列的终点坐标;S200:每个智能体分别观测动作价值网络模型所需的观测数据,并将其输入至动作价值网络模型中,通过动作价值网络模型评价每个智能体在各自的工作空间中的所有动作的动作价值,获取每个智能体的最优动作;S300:每个智能体分别执行各自的最优动作,直至全体智能体成功抵达终点。该方法能提高智能体对对不同避障情境的适应能力。
本发明授权一种多智能体编队避障方法、装置及存储介质在权利要求书中公布了:1.一种多智能体编队避障方法,其特征在于,包括如下步骤: S100:构建动作价值网络模型和训练环境模型,利用训练环境模型对动作价值网络模型进行训练,获得多智能体编队避障的动作价值网络模型,其中训练环境模型包括一个由多个智能体编队而成的智能体队列和多个动态障碍物,每个轮次的训练过程中随机设置动态障碍物的坐标和智能体队列的终点坐标; S200:每个智能体分别观测动作价值网络模型所需的观测数据,并将其输入至动作价值网络模型中,通过动作价值网络模型评价每个智能体在各自的工作空间中的所有动作的动作价值,获取每个智能体的动作价值最高的最优动作; S300:每个智能体分别执行各自的最优动作,直至全体智能体成功抵达终点; 其中,所述步骤S100中,动作价值网络模型在训练过程中的奖励函数包括避障奖励函数、编队奖励函数和导航奖励函数; 所述避障奖励函数ra被定义为: 式中,表示智能体的集合,表示动态障碍物的集合,b、c、ga均为常数系数,δij表示智能体与其他智能体或者动态障碍物之间的距离,δmin表示智能体的最小碰撞半径; 所述编队奖励函数rf被定义为: 式中,||.||F表示弗罗贝尼乌斯范数,tr{.}表示矩阵的迹,为智能体当前编队的归一化拉普拉斯矩阵,是理想编队的归一化拉普拉斯矩阵; 所述导航奖励函数rn被定义为: 式中,表示智能体的集合,和分别是智能体在当前时间步和上一时间步到终点的距离,Dg表示终点的半径,gg为到达终点的奖励的增益系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳技术大学,其通讯地址为:518000 广东省深圳市坪山区石井街道兰田路3002号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励