南京理工大学郭毓获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京理工大学申请的专利一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115256401B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211038250.5,技术领域涉及:B25J9/16;该发明授权一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法是由郭毓;余朝宝;詹腾达;高鼎峰;周宇航;许铭轩设计研发完成,并于2022-08-29向国家知识产权局提交的专利申请。
本一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法在说明书摘要公布了:本发明公开了一种强化学习的空间机械臂轴孔装配变阻抗控制方法,首先分别构建空间机械臂模型以及机械臂关节角状态和末端位姿的转换模型,之后利用双目相机采集装配孔的位置信息,构建基于强化学习的阻抗控制器,并利用神经网络对阻抗控制器进行训练,之后输入机械臂末端的实时信息,更新阻抗控制器的阻抗参数,输出机械臂末端的位置修正量,完成空间机械臂轴孔装配变阻抗控制。本发明的方案基于强化学习对空间机械臂轴孔装配进行变阻抗控制,其控制可以对动态力进行跟踪,动态误差较传统的定阻抗控制更小,响应速度也更快,可以有效削弱环境中不定因素的影响,与传统的定阻抗控制有着更优的跟踪精度。
本发明授权一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法在权利要求书中公布了:1.一种基于强化学习的空间机械臂轴孔装配变阻抗控制方法,其特征在于,包括以下步骤: 步骤1、基于DH参数法构建空间机械臂模型; 步骤2、基于正逆运动学算法构建空间机械臂关节角状态和末端位姿的转换模型; 步骤3、初始化双目相机的内外参数,并利用双目相机采集图像,获取装配孔的位置信息; 步骤4、构建基于强化学习的阻抗控制器,并根据预期目标设置训练过程中的阻抗参数动作表、奖励函数以及中止条件: 步骤4-1、构建阻抗控制器: ; 其中,,分别表示空间机械臂末端的实际运动轨迹和期望运动轨迹,表示机械臂末端与外部环境的作用力,分别对应阻抗控制器的期望惯性矩阵,期望刚度矩阵以及期望阻尼矩阵;、分别表示空间机械臂末端实际加速度、期望加速度、实际速度和期望速度,阻抗控制器中选取作为控制量; 步骤4-2、设置奖励函数: ; ; 其中,T表示单次训练时长,为期望力与当前时刻力的误差值; 步骤4-3、设置强化学习的阻抗参数动作表: ; 为设置的修正量; 步骤5、基于神经网络训练阻抗控制器: 首先设置训练的总次数,在单次训练中收集空间机械臂的经验表,并将其放置到经验池,对策略网络进行更新,通过策略网络中的预测值与目标网络之间的残差更新策略网络,设置更新时间,一旦超过该更新时间后,将目标网络利用策略网络进行替换,实现目标网络更新,最后通过目标网络更新环境中的反馈输出评分最高的动作,依次循环,直至最终设置的训练总次数大于设定值,结束训练; 所述策略网络对基于强化学习的阻抗控制器中的当前时刻的Q值进行预测,基于目标网络对基于强化学习的阻抗控制器中的下一时刻的Q值进行预测,并将两个时刻的差值的均方误差作为损失函数: ; 其中,表示均方误差,表示t时刻的Q值,表示学习过程中的衰减率; 所述策略网络采用全神经网络结构,将机械臂末端的位置、速度、加速度以及力误差值作为网络输入,隐藏层神经元数量设置为400,激活函数选择ReLU函数,输出当前时刻各动作的Q值; 所述目标网络采用全神经网络结构,将机械臂末端的位置、速度、加速度以及力误差信息作为网络输入,隐藏层神经元数量设置为400,激活函数选择ReLU函数,输出下一时刻各动作的Q值; 步骤6、输入机械臂末端的实时信息,更新阻抗控制器的阻抗参数,输出机械臂末端的位置修正量,完成空间机械臂轴孔装配变阻抗控制。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。