东南大学;北京大学叶海川获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学;北京大学申请的专利追逃场景下对抗生成模仿学习的无人机围捕资源分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119514614B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411583205.7,技术领域涉及:G06N3/0475;该发明授权追逃场景下对抗生成模仿学习的无人机围捕资源分配方法是由叶海川;孔诗涵;薛磊;武永宝;刘剑设计研发完成,并于2024-11-07向国家知识产权局提交的专利申请。
本追逃场景下对抗生成模仿学习的无人机围捕资源分配方法在说明书摘要公布了:追逃场景下对抗生成模仿学习的无人机围捕资源分配方法,旨在确定多对多追逃场景下各个追捕者无人机的追击目标,从而解决围捕资源分配问题。该方法首先针对多对多追无人机逃场景建立系统模型并进行符号声明。随后引入阿波罗尼斯圆的概念,建立用于无人机围捕资源分配的势博弈模型。接着,提出了一种基于线性规划的最优围捕资源分配方案求解算法。最后,提出了一种基于对抗生成模仿学习的无人机围捕资源分配算法。本发明设计的算法,不受追逃双方无人机数量与初始状态的影响,可以采用线性规划算法寻找势博弈下的纳什均衡,并基于对抗生成模仿学习自适应学习最优围捕资源分配方案,最终实现多对多无人机追逃场景下围捕资源的实时动态分配调度。
本发明授权追逃场景下对抗生成模仿学习的无人机围捕资源分配方法在权利要求书中公布了:1.追逃场景下对抗生成模仿学习的无人机围捕资源分配方法,其特征在于:包括如下步骤: 步骤1:基于多对多无人机追逃场景构建系统模型并进行符号声明,通过定义绝对直角夺标系和相对极坐标系,描述追逃双方无人机的位置关系,并定义追逃双方的动作空间,从而引出资源分配矩阵和追捕小组集合概念; 步骤2:引入阿波罗尼斯圆的概念,构建基于阿波罗尼斯圆的无人机围捕资源分配势博弈,证明围捕资源分配具有纳什均衡解,即最优围捕资源分配方案的存在性,具体如下; 步骤2‑1.引入阿波罗尼斯圆的概念,并使用阿波罗尼斯凸多边形面积来描述追逃双方的竞争关系,具体为: 设平面上有A,B两点,若存在动点C,满足: ; 则点C在平面中构成的轨迹为一个圆,称该圆为阿波罗尼斯圆,其中,为连接点C和点A,点B的线段,是一个小于1的正常数,即; 在追逃场景下,第个追捕者无人机的坐标为,速度为,第个逃跑者无人机的坐标为,速度为,为确保追捕的可行性,设追逃双方之间的速度满足,基于二者之间的位置和速度比,构建基于追逃的阿波罗尼斯圆,阿波罗尼斯圆上的点为追逃双方保持匀速直线运动条件下未来的相遇点,该圆上任意一点满足: ; 构建的阿波罗尼斯圆的圆心半径满足: ;当存在个追捕者无人机追捕一个逃跑者无人机时,即个追捕者无人机构成的追捕小组追捕第个逃跑者无人机时,此时追捕小组内的各个追捕者无人机都可以和逃跑者无人机构建一个阿波罗尼斯圆,各个阿波罗尼斯圆的重叠部分称为阿波罗尼斯凸多边形; 当存在多个逃跑者无人机时,同理可得,存在多个追捕小组追捕相应的逃跑者无人机,对于每一个追捕小组,都可以和小组的追击目标形成一个阿波罗尼斯凸多边形,记追捕小组对第j个逃跑者无人机形成的阿波罗尼斯凸多边形的面积为,根据的大小,衡量追捕小组的围捕效果,越小,代表逃跑者无人机潜在的生存空间较小,即围捕效果较好,反之越大,逃跑者无人机潜在的生存空间越大,围捕效果较差; 步骤2‑2.构建基于阿波罗尼斯圆的无人机围捕资源分配势博弈,具体为: 定义:是一个势博弈,如果对,满足: ; 其中为符号函数,,是第i个追捕者无人机的效用函数,是势函数,为各个逃跑者无人机的动作集合,,为全体追捕者无人机的动作集合,,为除去后其他追捕者无人机的动作集合,各个智能体之间动作满足: ; 各个追捕者无人机的追击目标共同组成资源分配矩阵,当第个追捕者无人机的动作由变为 时,设资源分配矩阵由变为,为确保资源分配方案的合理性和可行性,要求无论是还是,均需要满足,该条件确保了不会出现,即每一个逃跑者无人机都至少有一个追捕者无人机追击; 证明:设智能体的效用函数以及势函数如下: ; 设当全体逃跑者无人机的动作由转换为,第个追捕者无人机的动作由变为 时,在满足的条件下,各个逃跑者无人机对应的阿波罗尼斯凸多边形的面积发生变化,假设第个逃跑者无人机对应的阿波罗尼斯圆面积变化量为,则: ; 同理对于势函数: ; 故而满足: ; 证明完毕; 根据定理得,任何有限势博弈均存在纯策略纳什均衡,故而对于基于阿波罗尼斯圆的无人机围捕资源分配势博弈,其存在纯策略纳什均衡,即最优围捕资源分配方案是存在的; 步骤3:根据步骤2的理论基础,提出了一种基于线性规划算法的最优围捕资源分配方案求解算法,该算法基于步骤2的理论,将无人机围捕资源分配问题转化为多约束的优化问题,通过线性规划求出围捕资源分配的最优解; 步骤4: 根据步骤3所设计的最优围捕资源分配方案求解算法,将其求得的无人机围捕资源分配最优解作为判别器网络的专家方案,构建损失函数训练判别器网络; 步骤5: 为根据生成器网络的输出值确定各个追捕者无人机的唯一追击目标,采用gumbel‑softmax进行重参数化操作,该操作在保证可导的同时可以抽样得到符合离散概率分布的追击目标值; 步骤6: 根据步骤4和步骤5产生的数据,使用深度强化学习算法训练分配给各个追捕者无人机的生成器网络,使得各个生成器网络的输出值逐渐向最优围捕资源分配方案拟合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;北京大学,其通讯地址为:210000 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励