当前位置 : 首页 > 专利喜报 > 广西大学殷林飞获国家专利权

广西大学殷林飞获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉广西大学申请的专利一种双向门控循环网络及量子Transformer网络的路径规划方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN116772857B 。

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202310747753.8，技术领域涉及：G01C21/20；该发明授权一种双向门控循环网络及量子Transformer网络的路径规划方法是由殷林飞;韦春有;胡立坤设计研发完成，并于2023-06-25向国家知识产权局提交的专利申请。

本一种双向门控循环网络及量子Transformer网络的路径规划方法在说明书摘要公布了：本发明提出一种双向门控循环网络及量子Transformer网络的路径规划方法，用于解决多移动机器人人的路径规划问题。该方法使用双向门控循环网络匈牙利方法来解决任务分配问题。量子计算方法被结合到Transformer神经网络中形成量子Transformer神经网络。量子Transformer神经网络与强化学习的决策过程相结合，形成基于量子Transformer神经网络的多智能体深度强化学习方法。基于量子Transformer神经网络的多智能体深度强化学习方法为已经分配任务的移动机器人规划路径。所述双向门控循环网络及量子Transformer神经网络的路径规划方法能够提高多移动机器人系统的任务分配方案的准确度，缩短训练时间，能给出准确度高的路径规划动作，优化移动机器人的路径，减少不同移动机器人之间出现碰撞。

本发明授权一种双向门控循环网络及量子Transformer网络的路径规划方法在权利要求书中公布了：1.一种双向门控循环网络及量子Transformer网络的路径规划方法，其特征在于，将双向门控循环网络、匈牙利方法、量子计算方法、Transformer神经网络以及强化学习决策方法进行结合，用于多移动机器人的路径规划，能提高任务分配方案的准确度，缩短训练时间，能给出准确度高的路径规划动作，优化移动机器人的路径，减少不同移动机器人之间出现碰撞；在使用过程中的步骤为：步骤1：多移动机器人系统中存在至少一个移动机器人和一个任务；移动机器人和任务的初始位置都是随机的；任务的位置能变动，位置能变动的任务为移动目标点；多移动机器人路径规划方法需要先为移动机器人分配任务才能给移动机器人规划路径；任务分配方法需要为每一个任务指派一个移动机器人来执行；在不考虑不同移动机器人的路径间的冲突的前提下，任务分配方法合理地为移动机器人分配任务使得移动机器人的路径总长度最短；路径规划方法需要为已经分配任务的移动机器人规划从移动机器人的位置到任务位置的路径，且需要充分考虑不同移动机器人的路径间的冲突；步骤2：双向门控循环网络由输入层、隐藏层和输出层组成；隐藏层由前向隐藏层和后向隐藏层组成；前向隐藏层和后向隐藏层是两个方向相反的门控循环网络；输入层将信息分别传递到前向隐藏层和后向隐藏层；前向隐藏层将信息在前向隐藏层内部传递并且将信息传递到输出层；后向隐藏层将信息在后向隐藏层内部传递并且将信息传递到输出层；步骤3：双向门控循环网络在时间的隐藏层状态由前向隐藏层状态以及后向隐藏层状态得到： 1 2 3 其中，为时间下的前向隐藏层状态，为时间下的前向隐藏层状态，为时间下的后向隐藏层状态，为时间下的后向隐藏层状态，为一种将输入向量编码成相应的隐藏层状态的非线性变换函数，为函数除隐藏层状态之外的其他输入，为前向隐藏层的权重系数，为后向隐藏层的权重系数，为时间下隐藏层状态对应于前向隐藏层状态以及后向隐藏层状态的偏移；步骤4：两个双向门控循环网络用于预测移动目标点以及移动障碍物的位置；第一个双向门控循环网络采用移动目标点位置数据集训练；移动目标点位置数据集包括所有移动目标点的以往位置；训练好的第一个双向门控循环网络输出移动目标点的预测位置；第二个双向门控循环网络采用移动障碍物位置数据集训练；移动障碍物位置数据集训练包括所有移动障碍物的以往位置；训练好的第二个双向门控循环网络输出移动障碍物的预测位置；步骤5：双向门控循环网络与匈牙利方法结合，形成一种双向门控循环网络匈牙利方法用于多移动机器人系统的任务分配；两个双向门控循环网络分别获取多移动机器人系统的移动目标点的以往位置以及移动障碍物的以往位置；两个双向门控循环网络分别输出移动目标点的预测位置以及移动障碍物的预测位置；A*方法根据移动目标点的预测位置以及移动障碍物的预测位置计算多移动机器人系统的距离信息；距离信息包括移动机器人到移动目标点的距离信息以及移动目标点之间的距离信息；匈牙利方法利用距离信息计算任务分配方案；匈牙利方法根据距离信息创建一个权值矩阵；权值矩阵表示二分图中每一对顶点之间的权值；匈牙利方法对矩阵的每一行减去权值矩阵的最小值，再对每一列减去权值矩阵的最小值；匈牙利方法用尽量少的水平线和垂直线画出尽可能多的零元素；若水平线和垂直线数量的和等于权值矩阵的阶数，则匈牙利方法找到最优解；若水平线和垂直线数量的和不等于权值矩阵的阶数，则匈牙利方法需要找到权值矩阵中未被线覆盖的元素中的最小值，并根据最小值来对权值矩阵进行更新操作；匈牙利方法的更新操作把被水平线覆盖的行上的元素加上最小值，同时，把被垂直线覆盖的列上的元素减去最小值；匈牙利方法重复上述过程，直至水平线和垂直线数量的和等于权值矩阵的阶数；步骤6：自注意力结构被应用于Transformer神经网络的编码器和解码器中；多头自注意力结构是多个自注意力结构的叠加；自注意力结构中执行遮掩操作的多头自注意力结构为带遮掩的多头自注意力结构；Transformer神经网络的自注意力结构的输入为查询矩阵、键值矩阵以及值矩阵；输出为： 4 其中，为查询矩阵的列数，为矩阵的转置操作，为一种激活函数，能把矩阵的每一行的和都变为1；函数的输出结果是注意力系数；步骤7：量子计算方法与自注意力结构结合形成变分量子本征求解器自注意力结构；变分量子本征求解器自注意力结构中采用控制旋转门操作替代经典态下的自注意力结构中的点积操作；变分量子本征求解器自注意力结构中采用量子振幅放大模块来替代经典态下的自注意力结构中的函数模块；量子振幅放大模块输出的注意力系数被输入到变分量子本征求解器中进行优化；步骤8：控制旋转门是一种在量子计算中用于控制比特之间相互作用和旋转的方法；控制旋转门能用于单比特旋转门的控制，能扩展到多比特的旋转操作；控制旋转门通过组合控制非门和单比特旋转门，实现各种类型的控制旋转门，进而实现复杂的量子计算方法和逻辑电路；步骤9：在量子振幅放大模块中，一个量子态分解为标准正交基态的线性组合；振幅放大公式为： 5 6 其中，为量子态下的旋转次数，为振幅放大算子，为振幅放大算子的次方，为量子态下的旋转角度，为正弦函数,为余弦函数；量子振幅放大模块的核心是选择合适的旋转次数使得最接近1；步骤10：在变分量子本征求解器中，注意力系数为输入到变分量子本征求解器的量子线路中的待优化参数；量子线路中的铺片把量子系统的哈密顿量分解成能够测量的泡利项之和；变分量子本征求解器的测量模块在量子线路上测量分解后的哈密顿量的期望值；变分量子本征求解器调整待优化参数使能量期望最小；变分量子本征求解器选定一个试探波函数，并测量出的能量期望： 7 8 其中，为设定的参考态，为指定的指数激励运算符，为电子哈密顿量；为通过共轭转置得到的左旋表示；步骤11：在变分量子本征求解器自注意力结构中，查询矩阵和键值矩阵经过量子编码模块编码为量子态后输入控制旋转门；控制旋转门的输出结果输入到量子振幅放大模块中；带遮掩的量子多头自注意力结构经过遮掩操作将控制旋转门的输出结果输入到量子振幅放大模块中；量子振幅放大模块的输出结果为注意力系数；变分量子本征求解器接收量子振幅放大模块输出的注意力系数，并对注意力系数进行优化；优化后的注意力系数被返回量子振幅放大模块中；注意力系数不断在量子振幅放大模块与变分量子本征求解器中传递，直至得到最终的优化结果；优化后的注意力系数的输出结果经过量子解码模块解码为经典态；优化后的注意力系数与值矩阵经过矩阵点积操作得到变分量子本征求解器自注意力结构的最终输出结果；步骤12：量子多头自注意力结构和带遮掩的量子多头自注意力结构都由多个变分量子本征求解器自注意力结构叠加得到；量子多头自注意力结构和带遮掩的量子多头自注意力结构整合不同的变分量子本征求解器自注意力结构的输出结果到一个整合矩阵中；整合矩阵经过矩阵变换后的输出即为量子多头自注意力结构的输出；步骤13：基于量子多头自注意力结构的编码块和解码块分别为量子编码块和量子解码块；量子编码块由一个量子多头自注意力结构、两个残差连接及归一化层和一个全连接层组成；量子编码块的输入矩阵分别输入到量子多头自注意力结构以及残差连接及归一化层中；量子多头自注意力结构的输出结果为残差连接及归一化层的输入；残差连接及归一化层的输出结果为下一个残差连接及归一化层以及全连接层的输入；全连接层的输出为下一个残差连接及归一化层的输入；下一个残差连接及归一化层的输出即为量子编码块的输出；量子解码块由一个量子多头自注意力结构、一个带遮掩的量子多头自注意力结构、三个残差连接及归一化层和一个全连接层组成；量子解码块的结构是在量子编码块结构的基础上再引入一个带遮掩的量子多头自注意力结构以及残差连接及归一化层；量子解码块的量子多头自注意力结构的输入来自量子编码块的输出以及残差连接及归一化层的输出；步骤14：基于量子编码块和量子解码块的Transformer神经网络为量子Transformer神经网络；量子Transformer神经网络由编码器和解码器两部分组成；编码器含有6个依次相连的量子编码块；解码器含有6个依次相连的量子解码块；在量子Transformer神经网络中，环境信息被编码成输入矩阵后输入到第1个量子编码块中；除第1个量子编码块外，其余量子编码块的输入为上一个量子编码块的输出；第6个量子编码块的输出是编码器的最终输出，即编码信息矩阵；编码信息矩阵为全部6个量子解码块的输入；除第1个量子解码块外，其余量子解码块的输入部分还包含上一量子解码块的输出；第6个量子解码块的输出即为解码器的最终输出；解码器的输出即为量子Transformer神经网络的最终输出；步骤15：量子Transformer神经网络与强化学习的决策过程相结合，形成基于量子Transformer神经网络的多智能体深度强化学习方法；移动机器人是智能体的一种；基于量子Transformer神经网络的多智能体深度强化学习方法被用于为已经分配任务的移动机器人规划出相互之间无碰撞的路径；在一个状态下，单个移动机器人利用量子Transformer神经网络来评估当前状态下动作的Q值；不同移动机器人在一个状态下的不同Q值被整合到一个混合网络中来得到多移动机器人系统在该状态下的联合Q值；混合网络评估每一个移动机器人的动作对整个系统的影响，并将联合Q值展开为单个移动机器人的Q值；联合Q值展开为： 9 10 11 12 其中，为一个依赖于当前状态的常量，为第个智能体的一阶增益系数，为第个智能体的Q值，为第个智能体的Q值，为第个智能体的Q值，为第个智能体的Q值，为第个智能体的Q值，为第和第个智能体的联合增益系数，为第到第个智能体的联合增益系数，为k阶乘，为的一阶微分运算符，为的二阶微分运算符，为的阶微分运算符，为的一阶微分运算符，为的一阶微分运算符，为的一阶微分运算符，为的一阶微分运算符，为的一阶微分运算符；在智能体的训练过程中的每一个时间步内，智能体选择随机动作的概率是ε，选择具有最大Q值的动作的概率是1-ε；步骤16：训练好的基于量子Transformer神经网络的多智能体深度强化学习方法用于多移动机器人的路径规划，规划出移动机器人相互之间无碰撞的路径。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人广西大学，其通讯地址为：530004 广西壮族自治区南宁市西乡塘区大学东路100号广西大学；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

广西大学殷林飞获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务