Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 江苏科技大学王卫东获国家专利权

江苏科技大学王卫东获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉江苏科技大学申请的专利一种基于改进DDQN算法的移动机器人动态路径规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119952697B

龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510049295.X,技术领域涉及:B25J9/16;该发明授权一种基于改进DDQN算法的移动机器人动态路径规划方法是由王卫东;柯蝶云设计研发完成,并于2025-01-13向国家知识产权局提交的专利申请。

一种基于改进DDQN算法的移动机器人动态路径规划方法在说明书摘要公布了:本发明公开了一种基于改进DDQN算法的移动机器人动态路径规划方法,包括:搭建动态模拟环境;构建路径规划模型,包括神经网络模块、经验回放模块、智能体控制模块;初始化动态模拟环境以及路径规划模型;基于改进DDQN与BOAE机制的融合策略对路径规划模型进行训练;加载训练好的移动机器人路径规划模型,智能体依据策略网络输出的最优动作决策驱动机器人在动态环境中运行,环境模拟模块实时反馈机器人位置及状态,可视化模块展示机器人最优路径。本发明通过将BOAE与改进DDQN算法相结合的创新方式,移动机器人能够在动态环境下更高效、精准地进行路径规划,显著提高避障能力和到达目标的成功率,具有极为广阔的应用前景和推广价值。

本发明授权一种基于改进DDQN算法的移动机器人动态路径规划方法在权利要求书中公布了:1.一种基于改进DDQN算法的移动机器人动态路径规划方法,其特征在于,包括如下步骤: S1:搭建动态模拟环境; S2:构建路径规划模型,包括神经网络模块、经验回放模块、智能体控制模块; S3:初始化动态模拟环境以及路径规划模型; S4:基于改进DDQN与BOAE机制的融合策略对路径规划模型进行训练; S5:加载训练好的移动机器人路径规划模型,智能体依据策略网络输出的最优动作决策驱动机器人在动态环境中运行,环境模拟模块实时反馈机器人位置及状态,可视化模块动态记录机器人路径,测试结束后,可视化模块展示机器人最优路径; 步骤S2中神经网络模块包括构建的策略网络和目标网络,依托PyTorch框架搭建多层全连接层结构;多层全连接层结构中,首层fc1将输入维度映射至256维,中间层fc2保持256维处理,末层fc3输出维度与动作空间维度匹配;各层间激活函数选用ReLU,策略网络依据融合BOAE信息的观测向量生成对应各离散动作的Q值,为机器人动作决策提供精准依据;目标网络用于辅助策略网络训练,初始复制策略网络参数,后续按特定更新规则调整参数; 步骤S2中策略网络依据融合BOAE信息的观测向量生成对应各离散动作的Q值,Q值的计算过程包括: 1输入处理 首先,将融合BOAE信息的观测向量x作为输入;假设观测向量x={x1,x2,...,xn},其中n是观测向量的维度; 2首层全连接层计算 将观测向量x输入到首层全连接层fc1,fc1中的每个神经元j会对输入进行加权求和,并加上偏置项b1j,即:其中w1ij是fc1中第i个输入到第j个神经元的连接权重; 然后应用ReLU激活函数:a1j=ReLUz1j=max0,z1j,得到fc1的输出:a1=[a11,a12,...,a1m],其中m=256,为fc1输出维度; 3中间层全连接层计算 对于fc2中的每个神经元k,w2jk是fc2中第j个输入到第k个神经元的连接权重,b2k是偏置项; 再次应用ReLU激活函数:a2k=ReLUz2k=max0,z2k,得到fc2的输出:a2=[a21,a22,...,a2m] 4末层全连接层计算 末层fc3的计算,对于输出的每个动作对应的维度l,w3kl是fc3中第k个输入到第l个输出的连接权重,b3l是偏置项; 此时,z3l就是对应每个离散动作的Q值,即Ql=z3l,最终得到的Q值向量Q=[Q1,Q2,...,Qs],s为动作空间的维度,代表了机器人在当前观测下采取每个离散动作的价值; 步骤S2中智能体控制模块协同各模块运作,合理配置关键训练参数,包括折扣因子、学习率、探索率及其衰减率、最小探索率、目标网络更新频率、经验回放的记忆容量,并且引入n步长参数、软更新参数τ和正则化系数λ,实现特定改进策略; 步骤S4中结合n步奖励计算机制、软更新与正则化结合策略和BOAE机制融合策略对路径规划模型进行训练,其中, n步奖励计算机制: 软更新与正则化结合策略:软更新策略则通过引入软更新参数τ,使目标网络参数能够逐步、平稳地向策略网络参数靠近,避免了参数更新过程中的剧烈波动;同时,在损失函数计算中加入正则化项,通过正则化系数λ对损失函数进行调整; BOAE机制融合策略:BOAE机制从状态和动作分析避障反应,利用交叉注意力和对决网络以及生成辅助奖励因子等多维度对机器人避障能力进行强化。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏科技大学,其通讯地址为:212000 江苏省镇江市梦溪路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。