中国人民解放军国防科技大学徐坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军国防科技大学申请的专利一种无人机信息收集的控制方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116859719B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310658911.2,技术领域涉及:G05B13/04;该发明授权一种无人机信息收集的控制方法、设备及介质是由徐坤;但阳鹏;段超凡;杨帆设计研发完成,并于2023-06-05向国家知识产权局提交的专利申请。
本一种无人机信息收集的控制方法、设备及介质在说明书摘要公布了:本发明公开了一种无人机信息收集的控制方法,包括:定义连续状态和动作空间下无人机进行信息收集的过程,将无人机对多个节点在给定时间内收集的信息的量最大化作为优化目标;将连续状态和动作空间下有状态估计误差的无人机信息收集的优化目标求解转化为稳健强化学习中的最优控制策略求解;利用基于策略梯度的稳健Actor‑Critic学习算法获取连续状态和动作空间下有状态估计误差时的最优控制策略。本发明首次提出了如何处理在连续状态和动作空间下、无人机状态存在估计误差且被收集信息节点信息未知的综合情况下的信息收集自主控制问题,并将该问题转化为稳健强化学习中的最优控制策略求解,最后利用稳健Actor‑Critic学习算法进行解算,从而扩展了应用场景。
本发明授权一种无人机信息收集的控制方法、设备及介质在权利要求书中公布了:1.一种无人机信息收集的控制方法,其特征在于,包括: 定义连续状态空间和动作空间下无人机进行信息收集的过程,将无人机对多个节点在给定时间内收集的信息的量最大化作为优化目标; 将连续状态空间和动作空间下有状态估计误差的无人机信息收集的优化目标求解转化为稳健强化学习中的最优控制策略求解; 利用基于策略梯度的稳健Actor-Critic学习算法获取连续状态空间和动作空间下有状态估计误差时的最优控制策略; 其中,所述利用基于策略梯度的稳健Actor-Critic学习算法获取连续状态空间和动作空间下有状态估计误差时的最优控制策略包括: 通过稳健时间差分算法获取稳健动作值的近似值; 基于获取的所述稳健动作值的近似值,采用稳健Actor-Critic学习算法获取最优控制策略函数的解,即获取所述最优控制策略; 其中,所述稳健动作值的表达式包括: 其中,表示初始状态下的稳健状态值对应的稳健动作值,,表示状态空间;表示对多次状态转移为的情况下获得的期望累计信息量;表示不同的多次状态转移中对应的最坏情况下收集的期望累计信息量;表示无人机在总的飞行时间内进行的最大决策次数;表示折扣因子,满足;表示无人机在状态时收集到的所有节点信息量之和的归一化值,表示无人机在第次决策时所采取的动作,,表示动作空间;表示初始动作;表示由参数确定的控制策略; 所述状态空间的表达式包括: 其中,表示时刻时无人机所处位置的三维坐标;和分别表示无人机飞行高度的最小值和最大值;表示无人机在垂直方向上的爬升角;表示无人机在水平方向上的偏航角;表示矩阵转置操作; 所述动作空间的表达式包括: 其中,表示无人机的飞行速度;和分别表示偏航角的角速率和爬升角的角速率;和分别表示偏航角的角速率的最大值和爬升角的角速率的最大值;和分别表示无人机的飞行速度的最小值和最大值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。