哈尔滨工业大学邵翔宇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于位置环预训练的人形机器人力矩控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118809606B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411099835.7,技术领域涉及:B25J9/16;该发明授权一种基于位置环预训练的人形机器人力矩控制方法是由邵翔宇;谭睿宇;孙光辉;吴承伟;周栋;季奕;吴立刚设计研发完成,并于2024-08-12向国家知识产权局提交的专利申请。
本一种基于位置环预训练的人形机器人力矩控制方法在说明书摘要公布了:一种基于位置环预训练的人形机器人力矩控制方法,本发明涉及基于位置环预训练的人形机器人力矩控制方法,属于人形机器人运动控制技术领域。本发明的目的是为了解决现有方法在机器人控制中难以在动态环境中保持鲁棒性和通用性的问题。过程为:根据人形机器人的结构,确定状态空间和动作空间;确定位置控制策略网络、力矩控制策略网络和价值网络的网络结构;设置训练相关参数;构建位置控制策略网络的奖励函数;奖励函数由风格项、任务项、正则化项三个部分组成;获得训练好的位置控制策略网络和力矩控制策略网络;将机器人当前状态输入训练好的力矩控制策略网络,训练好的力矩控制策略网络输出力矩,根据力矩对人形机器人进行实时控制。
本发明授权一种基于位置环预训练的人形机器人力矩控制方法在权利要求书中公布了:1.一种基于位置环预训练的人形机器人力矩控制方法,其特征在于:所述方法具体过程为: 步骤一、根据人形机器人的结构,确定状态空间和动作空间; 步骤二、确定位置控制策略网络,力矩控制策略网络和价值网络的网络结构; 位置控制策略网络、力矩控制策略网络和价值网络均为多层感知机; 其中和分别为位置控制策略网络和力矩控制策略网络的网络参数,是价值网络的网络参数; 步骤三、设置训练相关参数; 步骤四、构建位置控制策略网络训练与正式训练的奖励函数; 位置控制策略网络训练与正式训练采用相同的奖励函数,奖励函数均由风格项、任务项、正则化项三个部分组成; 步骤五、基于步骤一、二、三、四,获得训练好的位置控制策略网络; 步骤六、基于训练好的位置控制策略网络,获得训练好的力矩控制策略网络; 步骤七、将机器人当前状态输入训练好的力矩控制策略网络,训练好的力矩控制策略网络输出力矩,根据力矩对人形机器人进行实时控制; 所述步骤四中构建位置控制策略网络训练与正式训练的奖励函数; 位置控制策略网络训练与正式训练采用相同的奖励函数,奖励函数均由风格项、任务项、正则化项三个部分组成; 具体过程为: 步骤四一、获得风格项,风格项包括机器人基座风格奖励项、机器人关节位置的风格奖励项、地面反作用力的奖励、速度的奖励、末端执行器跟踪奖励; 步骤四二、获得任务项; 步骤四三、获得正则化项,正则化项包括动作正则化项、力矩正则化项和力矩变化正则化项; 所述步骤四一中获得风格项,风格项包括机器人基座风格奖励项、机器人关节位置的风格奖励项、地面反作用力的奖励、速度的奖励、末端执行器跟踪奖励;具体过程为: 步骤四一一、获机器人基座风格奖励项,机器人关节位置的风格奖励项; 具体过程为: 其中表示机器人基座风格奖励项,表示机器人关节位置的风格奖励项,和分别表示为t时刻参考动作的朝向与实际关节朝向;和分别表示为t时刻参考动作的关节位置和实际关节位置;表示机器人基座对应的权重,表示关节位置的对应的权重,表示乘号,表示二范的平方数; 步骤四一二、获得地面反作用力的奖励和速度的奖励; 具体过程为: 机器人与地面的接触类型分为两种: 1、双足接触相DS,即两脚同时与地面保持接触的状态; 2、单足支撑相SS,即一脚与地面接触以提供支撑,另一脚悬空摆动; 当执行站立动作时,机器人一直处于DS阶段; 当执行行走动作时,机器人将交替经过DS阶段和SS阶段; 当执行跑步动作时,机器人将交替出现SS阶段以及浮空阶段; 设定相位指示器,分别为机器人左脚地面反作用力相位指示器、机器人右脚地面反作用力相位指示器、机器人左脚速度相位指示器和机器人右脚速度相位指示器; 对于站立和行走动作中的DS阶段,且; 对于跑步动作,且; 对于行走动作和跑步动作中的SS阶段,针对左脚作支撑脚SSleft,且;针对右脚作支撑脚SSleft,且; 基于机器人左脚地面反作用力相位指示器、机器人右脚地面反作用力相位指示器、机器人左脚速度相位指示器和机器人右脚速度相位指示器,获取地面反作用力的奖励和速度的奖励,表达式为: 其中,和是归一化后的地面反作用力,和是归一化后的速度; 为地面反作用力的奖励,为乘号,为速度的奖励; 步骤四一三、获得末端执行器跟踪奖励; 具体过程为: 末端执行器跟踪奖励定义为: 其中,代表在时刻的末端执行器的参考位置,代表实际位置,代表末端执行器位置对应的权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。