Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连海事大学刘洪波获国家专利权

大连海事大学刘洪波获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连海事大学申请的专利一种模型-数据混合驱动固定翼无人机自主认知避障方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116736880B

龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310421892.1,技术领域涉及:G05D1/495;该发明授权一种模型-数据混合驱动固定翼无人机自主认知避障方法是由刘洪波;马润泽;王乃尧;王野;赵正;江同棒设计研发完成,并于2023-04-19向国家知识产权局提交的专利申请。

一种模型-数据混合驱动固定翼无人机自主认知避障方法在说明书摘要公布了:本发明公开了一种模型‑数据混合驱动固定翼无人机自主认知避障方法,包括以下步骤:建立慢通路瞬时机动避障模型;建立快通路自适应位姿控制模型;建立类脑快慢双通路混合驱动机动动作优化模型。本发明采用类脑快慢双通路架构,合理地设计长短期决策博弈策略,实现快慢通路各自有效强化机制,实施通路间动态博弈,最终决策选择中两个通路既相对独立、又相互增强,实现整个类脑快慢双通路模型在迭代、回馈中有效形成直觉习惯,从而提升自主认知性能,有效地进行人工智能模型与人脑认知机制之间的映射,真正将脑与认知中快慢双通路交互机制和原理启发式地构建所需的自主智能系统,使自主智能系统实现智能认知。

本发明授权一种模型-数据混合驱动固定翼无人机自主认知避障方法在权利要求书中公布了:1.一种模型-数据混合驱动固定翼无人机自主认知避障方法,其特征在于:包括以下步骤: A、建立慢通路瞬时机动避障模型 首先建立复杂环境自主感知模块,得到固定翼无人机对外部环境的向量;然后建立瞬时预测时序记忆模块,对固定翼无人机状态进行时序预测;最后建立位姿机动自主控制模块,生成固定翼无人机最优控制行为;具体步骤如下: A1、建立复杂环境自主感知模块 通过雷达和摄像头对外部环境进行观察,得到输入图像,对输入图像按帧进行压缩,通过变分自编解码结构将视频帧编码为低维的隐向量,实现对于复杂环境的自主感知: 首先将输入图像的分辨率压缩为64×64×3,然后将图像编码降维到二维空间,得到μ向量和σ向量,μ向量和σ向量的形式定义为: μ={μ1,μ2,…,μd} σ={σ1,σ2,…,σd} 其中d表示μ向量和σ向量的维度; 设fθ表示μ向量的编码网络,fφ表示σ向量的编码网络,μ向量和σ向量的计算公式为: μ=fθx σ=fφx 式中,x为输入图像;输入图像的压缩特征Z为: Z={z1,z2,...,zd} 其中:zj=μj+ε·σj,ε~N0,1,zj为Z向量第j个参数,σj为σ向量第j个参数,μj为μ向量第j个参数;ε为服从标准正态分布的参数,符号~表示服从,N0,1为标准正态分布;j=1、2、…、d; 将Z作为瞬时预测时序记忆模块和位姿机动自主控制模块的输入,向量Z在t时刻的压缩特征为Zt,在t+1时刻的压缩特征为Zt+1,Z和Zt+1作为步骤A2的输入,复杂环境自主感知模块的损失函数Lvision如公式1所示: 其中,x为输入图像,为相应的重构形式,Lrecon为重构损失,即输入图像x和相应的重构形式的差异性,LKL为相对熵损失函数; A2、建立瞬时预测时序记忆模块 根据步骤A1得到的外部环境向量,利用混合密度循环神经网络对固定翼无人机的外部环境进行时序预测;循环神经网络以概率密度函数PZ的形式输出; 将概率密度函数PZ近似为高斯分布的混合,训练循环神经网络以历史和当前的可用信息输出t+1时刻的向量Zt+1的概率分布,实现瞬时预测时序记忆模块的功能;将循环神经网络建模为PZt+1|a,Z,h,运算符号|表示在a,Z,h条件下t+1时刻的向量Zt+1的概率分布,其中a是t时刻固定翼无人机采取的行为,Z为t时刻输入图像的压缩特征表示,Z={z,z,...,z,每个元素表示Z向量在t时刻对应维度的分量,Zt+1为t+1时刻输入图像的压缩特征表示,Zt+1={z,z,...,zt+1,每个元素表示Zt+1向量在t+1时刻对应维度的分量,h是t时刻的隐向量,ht={h,h,...,h,每个元素表示隐向量h在对应维度的分量; A3、建立位姿机动自主控制模块 接受复杂环境自主感知模块和瞬时预测时序记忆模块作为输入,并最大化累积奖励,生成对应的固定翼无人机控制行为; 位姿机动自主控制模块的输入包括: 复杂环境自主感知模块的输出Z 瞬时预测时序记忆模块中的隐向量h 位姿机动自主控制模块的输出为a,表示t时刻固定翼无人机采取的行为,如公式2所示: =tanhωZ;h+b2 其中,tanh·是激活函数,ω和b分别是权重矩阵和偏差向量,由于tanh·的值范围为-1至+1,根据公式3对a进行归一化: 式中,a[0]到a[4]表示输入向量Z映射到输出的动作向量; B、建立快通路自适应位姿控制模型 首先建立固定翼无人机运动数学模型,描述固定翼无人机飞行状态;然后建立固定翼无人机位姿解算模型,解算固定翼无人机飞行过程中的位姿参数;最后设计固定翼无人机稳定回路控制律,得到固定翼无人机控制系统的输出;具体步骤如下: B1、建立固定翼无人机运动数学模型 对固定翼无人机的飞行状态进行描述,建立固定翼无人机运动数学模型;固定翼无人机的姿态变化和航迹变化是基于动力学和运动学的物理过程,对固定翼无人机进行数学建模时采用不同的参考系,研究固定翼无人机的导航参数,所述导航参数包括姿态、位置和速度; 固定翼无人机质点运动微分方程组如公式4所示: 其中,为气动力在升力轴的分量,为气动力在阻力轴的分量,为气动力在侧力轴的分量,m为固定翼无人机的质量,ω为地面惯性坐标系下角速度矢量,v为速度矢量,g为重力加速度,F为发动机产生的推力,Φ为滚转角,θ为俯仰角,u、v、w分别为速度矢量在本体坐标系x、y、z方向上的投影标量,q、r分别为角速度矢量在本体坐标系y、z方向上的投影标量; B2、建立固定翼无人机位姿解算模型 固定翼无人机运动的一阶微分方程组如公式5所示: 其中,p、q、r是用陀螺仪测得的本体三轴角速度,其中p为x轴角速度,q为y轴角速度,r为z轴角速度;φ、θ、ψ是欧拉角,其中φ为滚转角,θ为俯仰角,ψ为偏航角;通过解算公式4,得到固定翼无人机的正交姿态角,后续导航计算时不再需要正交化处理; 下面利用加速度计和磁强计进行姿态修正;在固定翼无人机不存在自身加速度的情况下,三轴加速度计通过测量重力场在本体坐标系下的三轴分量,确定固定翼无人机的滚转角和俯仰角; 重力矢量在地面坐标系e下的表达式为: Ge=[00g] 当固定翼无人机相对地面坐标系没有加速运动时,三轴加速度计的测量值是: 式中,ab为本体坐标系下加速度分量,为本体坐标系下加速度东分量,为本体坐标系下加速度北分量,为本体坐标系下加速度垂直分量,并且有: 三轴磁强计沿本体坐标系安装,测量值为: 地面坐标系下,地磁强度值记为: 则偏航角的计算公式如6所示: 其中,为本体坐标系下地磁强度东分量,为本体坐标系下地磁强度北分量,为本体坐标系下地磁强度垂直分量,为地面坐标系下地磁强度东分量,为地面坐标系下地磁强度北分量,为本体坐标系下地磁强度垂直分量,上标b为本体坐标系,e为地面坐标系,下标x、y、z为地磁的东、北和垂直方向; B3、设计固定翼无人机稳定回路控制律 飞行控制系统通过控制固定翼无人机的飞行参数控制飞行状态和航迹,所述飞行参数包括滚转角、俯仰角、偏航角、高度和经纬度即飞机位置坐标;其中,高度和经纬度用于固定翼无人机航迹控制;滚转角、俯仰角、偏航角用于姿态控制; 为了提高固定翼无人机飞行控制系统的性能,采用一类非线性增益的PID控制器;在小扰动的情况下,固定翼无人机的纵向运动和横向运动之间的交联影响不严重,因此将飞行控制分解成相互独立的纵向控制通道和横向控制通道;其中纵向控制通道用于稳定控制固定翼无人机的俯仰角、高度和速度;横向控制通道用于稳定控制固定翼无人机的航向角、滚转角和偏航距离;则控制系统的输出如公式7所示: 其中,rt为控制指令,yt为输出量,ut为PID控制器的输出; 式中,kp为比例增益参数,ki为积分增益参数,kd为微分增益参数,采取非线性函数计算,如公式8所示: C、建立类脑快慢双通路混合驱动机动动作优化模型 采用厄普西隆贪婪策略控制固定翼无人机的运动系统以进行机动动作优化,具体步骤如下: C1、采用厄普西隆贪婪策略进行动作优化 厄普西隆贪婪策略的学习目标是在学习中获得一个策略π,表示为: π:S→A 这里的S表示有限的离散状态集合,A表示离散的动作集合,符号→表示在S状态下采取A动作的选择过程;时刻k在状态sk下,选择的动作为an∈Ak的概率分布为: πk={p1,p2,…,pn}; 假定在状态sk时,固定翼无人机采用的动作由来自数据驱动的慢通路瞬时机动避障模型的行为集合Ak={a1,a2,...,am}和来自模型驱动的快通路自适应位姿控制模型的PID行为控制量Uk={u1,u2,...,un}混合驱动动作优化决策,则此时选择动作aj,、uj的概率计算如公式9所示: 其中,m为行为集合的维度,n为行为控制量的维度,k为当前时刻,i为当前行为序号,j为当前行为控制量序号,Qsk,ai,uj为状态-策略组sk、ai、uj的值函数,参数εk为渐变参数,它的取值大小代表了动作选择时随机性的大小,参数εk越大说明动作的随机性越大;M为学习次数;当k=1时,εk≈1代表学习之初只探索不利用;当k=M时,εk≈0代表只利用不探索;0.99防止εk取到边界值0或1无意义状态;通过函数εk随k渐变的过程模拟由探索向利用经验知识的过渡过程,即固定翼无人机动作逐步优化的过程; C2、进行基于能量的动作跳转 在厄普西隆贪婪策略进行动作策略随机跳转时,对于动作策略选择的值函数Qsk,ai,uj,如果Qsk,ai+1,uj+1≥Qsk,ai,uj,即随机跳转后得到更优解,则总是接受该跳转;如果Qsk,ai+1,uj+1<Qsk,ai,uj,即随机跳转后得到比当前更差的解,那么就定义一个概率表达此次跳转的有效性;这里的概率大小与时间相关,随着时间序列的推进概率也逐渐降低,如公式10所示,当跳转能量值到达T时,能量差为dQ,概率为pdQ; 其中C是一个常数,由此知道,当跳转能量值T逐渐降低后,pdQsk,ai,uj也会随之会减小;这里把每一次向其他解域跳转的过程视为一次能量跳变,用概率pdQsk,ai,uj表达这种跳转被接受的程度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市高新园区凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。