西北工业大学郭斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种自由形式模块化机器人自重构方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116300423B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310003413.4,技术领域涉及:G05B13/04;该发明授权一种自由形式模块化机器人自重构方法是由郭斌;吴磊;孙卓;於志文;张洁逸;吕明泽设计研发完成,并于2023-01-03向国家知识产权局提交的专利申请。
本一种自由形式模块化机器人自重构方法在说明书摘要公布了:本发明公开了一种自由形式模块化机器人自重构方法,首先构建一类自由形式模块化机器人的基本要素抽象模型,每个机器人模块相互之间可以通过主、被动连接器从任意方向进行连接。然后基于硬件原型对该类资源有限的模块化机器人设计了合理的动作空间和观测空间,其中动作空间包含两个平面连续运动电机驱动参数和一个连接器运动参数,观测空间包含自身和邻居模块的运动信息和局部连接关系;将自由形式的模块化机器人的重构问题建模为分布式部分可观测的马尔可夫决策过程,基于近端策略优化算法,可以实现在连续动作空间中高效、无冲突重构的多智能体强化学习方法;最后,在局部可观测性和有限通信的条件下实现重构过程的及时终止。
本发明授权一种自由形式模块化机器人自重构方法在权利要求书中公布了:1.一种自由形式模块化机器人自重构方法,其特征在于,包括以下步骤: 步骤1:构建自由形式的模块化机器人抽象模型; 自由形式模块化机器人的每个模块被视为一个标准的球形,包括主动连接器、无源连接器和传感装置,模块由运动电机驱动;模块的球壳作为被动连接器使用;模块的运动电机在二维空间中具有连续运动能力,模块能够在所连接模块的表面上移动;模块之间能够相互通信; 考虑一个模块化的机器人系统{Mi},由n个模块组成,从构型空间X给定一对初始构型xstart和目标构型xtarget;自重构方法的目标是在允许动作空间U中找到一个动作序列{ui,t},使重构动作序列能够以最短的时间T将xstart转换为xtarget;任意给定的配置x由每个模块的位置信息Pi和所有模块的拓扑连接信息δi,j唯一决定;在重构过程中,动作空间U包含了使各模块的电机转矩和速度矢量在当前情况下满足相应的运动约束的动作; 步骤2:观察与动作空间设置; 每个模块的观察包括本体感知和环境感知;本体感知包括位置向量Pi、速度向量vi、利他主义因子αi和主动-被动连接关系δi,I\{i};每个模块还能够感知半径d内其他模块j的位置Pj和速度vj; 将主动连接器的连接或断开合并到模块的动作空间中,动作空间用一个元组<σ1,σ2,δlink表示;每个模块的链接动作用δlink表示,并假设只有相互接触的模块才能执行连接或断开连接的动作;两个运动电机的扭矩为σ1和σ2,用于驱动模块在平面上的任何方向移动;限制了模块的最大移动速度为vmax; 步骤3:奖励函数设计; 设计一个为所有模块共享的奖励函数,以训练模块学习重构策略: 其中,式中右边第一项是拓扑奖励,第二项是几何奖励,第三项是时间奖励,由超参数cp、cq和ct平衡; 对于每个模块Mi,与其他n1模块的连接关系用δi,j表示,其中j属于I\{i};拓扑奖励设计如下: 其中式中右边分子的前后两项分别为时间步为t-1和t时Mi的局部拓扑与目标拓扑之间的距离; 引入进一步的几何信息,几何奖励设计如下: 其中,式中右边第一项为模块的位移向量;为以Pi,t-1为起始点,以Pi,t、Pi,G为端点的两个向量之间的夹角;几何奖励度量了每个时间步长中模块沿正确方向移动到目标位置的有效距离; 步骤4:利他主义近端策略优化; 在多智能体强化学习中引入利他主义机制,实现模块之间的协作; 基于平均场思想定义每个模块的平均场奖励: 其中,Ni,t={j:||Pit-Pjt||≤d}是一个动态变化的集合,其中包含在Mi半径为d的范围内的其他模块的索引;平均场奖励代表在模块Mi周围动态变化的相邻模块的平均奖励; 引入利他主义量表形成利他主义奖励: 其中,αi是定义在-1,1上的利他主义因子,用于衡量每个模块对他人收益的态度;向量α是αi的集合,代表了整个种群中利他主义倾向的分布;利他主义因子αi是每个模块Mi的一个个性化属性; 利他主义近端策略优化方法的第一阶段通过集中训练和分散执行CTDE的方式来训练近端策略优化PPO,以最大化利他主义奖励RAS: 其中,利他主义优势函数为: 存在最优的αi的分布α*,使方法第一阶段训练的模型性能最佳; 基于元强化学习,为每个模块优化适当的个性化αi;利他主义近端策略优化方法的第二阶段的优化目标为: 通过链式法则和Taylor级数推导,用个性化利他因子改写上述优化目标的梯度,使得所有模块的个性化利他主义因素都能在训练中得到优化: 利他主义近端策略优化方法根据上述公式在事件尺度上进行梯度下降,以优化每个模块的利他主义因子,并在时间步尺度上进行梯度下降,同时使利他主义奖励RAS最大化; 步骤5:分布式异步终止准则; 所有模块都运行相同的分布式异步终止准则;每个模块根据其局部观测结果判断其局部连接关系是否与目标构型一致,当匹配一致并接收到所有子模块的就位信号Ω时,将就位信号Ω发送给父模块;这样,就位信号将从叶节点逐步分布式地传输到根节点;然后,根节点将终止信号Ω2传递给子节点并逐级传输;接收到Ω2信号的每个模块将立即终止重构过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励