重庆邮电大学王国胤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于模糊集和深度强化学习的自适应无人艇路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115599093B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211171757.8,技术领域涉及:G05D1/43;该发明授权一种基于模糊集和深度强化学习的自适应无人艇路径规划方法是由王国胤;段振华;刘群;石岩;邹贵银设计研发完成,并于2022-09-26向国家知识产权局提交的专利申请。
本一种基于模糊集和深度强化学习的自适应无人艇路径规划方法在说明书摘要公布了:本发明属于无人艇导航技术领域,具体涉及一种基于模糊集和深度强化学习的自适应无人艇路径规划方法;包括生成障碍物环境并记录信息,包括障碍物的位置和目标点的位置;构建无人艇模糊控制的模糊规则;在无人艇航行的过程中,实时计算无人艇分别相对于障碍物、目标点的距离,以及无人艇的偏航角;将实时计算的结果采用无人艇模糊规则处理输出模糊系数;深度强化学习中的奖励函数根据模糊系数对无人艇进行自适应奖励;根据无人艇在不同状态下的自适应奖励对无人艇路径规划模型进行训练;采用训练好的无人艇路径规划模型自主规划出最优路径;本发明实现了无人艇路径规划,保证了无人艇的安全,提高了无人艇执行任务的效率。
本发明授权一种基于模糊集和深度强化学习的自适应无人艇路径规划方法在权利要求书中公布了:1.一种基于模糊集和深度强化学习的自适应无人艇路径规划方法,其特征在于,包括以下步骤: S1.生成用于无人艇训练的障碍物环境并记录该障碍物环境信息,包括障碍物的位置和目标点的位置; S2.引入模糊逻辑构建无人艇模糊规则,采用隶属度函数描述无人艇与障碍物、目标点的距离以及无人艇的偏航角; 无人艇模糊规则包括障碍物模糊规则和目标模糊规则,具体为: 获取无人艇与障碍物之间的距离、无人艇与目标点之间的距离以及无人艇的偏航角,将无人艇与障碍物之间的距离以及无人艇的偏航角作为障碍物模糊规则的输入变量,将无人艇与目标点之间的距离以及无人艇的偏航角作为目标模糊规则的输入变量,障碍物模糊规则和目标模糊规则的输出变量分别为惩罚模糊系数和奖励模糊系数; 障碍物模糊规则:将输入变量模糊化,即将无人艇与障碍物之间的距离大小分为5段,BVN表示与障碍物的距离非常近,BN表示与障碍物的距离近,BA表示与障碍物的距离适中,BF表示与障碍物的距离远,BVF表示与障碍物的距离非常远;将无人艇的偏航角大小分为5段,NRB表示偏右大角度,NRS表示偏右小角度,Z表示零,PLS表示偏左小角度,PLB表示偏左大角度;将输出变量惩罚模糊系数分为5段,PVS表示惩罚模糊系数非常小,PS表示惩罚模糊系数小,PM表示惩罚模糊系数中等,PB表示惩罚模糊系数大,PVB表示惩罚模糊系数非常大,建立25条惩罚模糊规则;无人艇与障碍物之间的距离越近,且无人艇的偏航角越小,则惩罚模糊系数越大;无人艇与障碍物之间的距离越远,且无人艇的偏航角越大,则惩罚模糊系数越小; 目标模糊规则:将输入变量模糊化,即将无人艇与目标点之间的距离大小分为5段,TVN表示与目标点的距离非常近,TN表示与目标点的距离近,TA表示与目标点的距离适中,TF表示与目标点的距离远,TVF表示与目标点的距离非常远;无人艇的偏航角大小分为5段,与障碍物模糊规则的划分方式相同,NRB表示偏右大角度,NRS表示偏右小角度,Z表示零,PLS表示偏左小角度,PLB表示偏左大角度;将输出变量奖励模糊系数分为5段,RVS表示奖励模糊系数非常小,RS表示奖励模糊系数小,RM表示奖励模糊系数中等,RB表示奖励模糊系数大,RVB表示奖励模糊系数非常大,建立25条奖励模糊规则;无人艇与目标点之间的距离越近,且无人艇的偏航角越小,则奖励模糊系数越大;无人艇与目标点之间的距离越远,且无人艇的偏航角越大,则奖励模糊系数减小; S3.在无人艇航行的过程中,实时计算无人艇分别相对于障碍物、目标点的距离,以及无人艇的偏航角; S4.将步骤S3中实时计算的结果采用无人艇模糊规则进行处理,实时输出位于区间[0,1]的模糊系数; S5.设计无人艇奖励函数,无人艇奖励函数根据模糊系数对无人艇进行自适应奖励; 奖励函数包括正常航行、障碍物规避和到达目标点三个部分,正常航行表示无人艇的探测范围内没有障碍物,正常航行的奖励函数Rn表示为: 其中;ρgoal表示将无人艇和目标点当前时刻的距离、无人艇当前时刻的偏航角输入模糊逻辑控制器得到的奖励模糊系数,dgoal表示无人艇与目标点当前时刻的距离,dmax表示无人艇的初始位置与目标点的距离; 障碍物规避表示无人艇的探测范围内有障碍物,障碍物规避的奖励函数Rc表示为: 其中,ρobs表示将无人艇和障碍物当前时刻的距离、无人艇当前时刻的偏航角输入模糊逻辑控制器得到的惩罚模糊系数,rdet表示探测范围的最大半径,dobs表示无人艇与障碍物当前时刻的距离; 到达目标点的奖励函数Rend为常量值,其中,当无人艇到达目标点时,反馈的奖励为Rend;当无人艇到达环境边界时,反馈的惩罚为Rend;当无人艇与障碍物发生碰撞时,反馈的惩罚为Rend; S6.基于深度强化学习构建无人艇路径规划模型,根据无人艇在不同状态下的自适应奖励对无人艇路径规划模型进行训练;采用训练好的无人艇路径规划模型自主规划出最优路径; 基于模糊集和深度强化的自适应无人艇路径规划过程,包括: S11.计算t时刻无人艇与扫描范围内的最近障碍物的障碍物距离,无人艇与目标点的距离,以及无人艇的偏航角; S12.判断障碍物距离是否小于无人艇探测范围的检测半径,若是,则执行步骤S13,否则执行步骤S15; S13.判断障碍物距离是否小于安全距离,即无人艇一定不会发生碰撞的最小距离,若是,则说明无人艇与障碍物发生碰撞或无人艇超出环境边界,进而对无人艇反馈惩罚;否则执行步骤S14; S14.判断目标距离是否小于安全距离,若是,则说明无人艇到达目标位置,进而对无人艇反馈奖励,此轮训练完成;否则说明无人艇此时探测范围内发现障碍物,采用障碍物规避奖励函数计算惩罚,t=t+1,执行步骤S11; S15.判断目标距离是否小于安全距离,若是,则说明无人艇到达目标位置,进而对无人艇反馈奖励,此轮训练完成;否则说明无人艇此时处于安全区域内,采用正常航行奖励函数计算奖励,t=t+1,执行步骤S11。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。