北京航空航天大学胡庆雷获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种基于深度强化学习的接触式加工机器人运动规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119501934B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411662463.4,技术领域涉及:B25J9/16;该发明授权一种基于深度强化学习的接触式加工机器人运动规划方法是由胡庆雷;任厚泽;吴晗;董斐;邵小东;郑建英设计研发完成,并于2024-11-20向国家知识产权局提交的专利申请。
本一种基于深度强化学习的接触式加工机器人运动规划方法在说明书摘要公布了:本发明涉及一种基于深度强化学习的接触式加工机器人运动规划方法,所述方法包括:首先,基于DH参数和齐次变换矩阵建立了六自由度机械臂末端状态向量与基座、关节运动向量之间的位置级正、逆运动学模型;其次,综合考虑加工任务、进给速度、进给角度等约束,设计了多级奖励函数对作业参数规划;然后基于双延迟深度确定性策略梯度设计网络结构,对算法进行三层次优化;最后,依据网络结构设计规划流程,以磨抛加工为例,应用于智能接触式加工机械臂系统的规划任务中。本发明能够通过自主学习实现对接触式加工工艺多种加工参数的实时优化与控制,可用于接触式加工工艺动力学耦合情况下的智能安全规划。
本发明授权一种基于深度强化学习的接触式加工机器人运动规划方法在权利要求书中公布了:1.一种基于深度强化学习的接触式加工机器人运动规划方法,其特征在于,包括以下步骤: 第一步,基于机械臂系统的位置级正、逆机器人耦合运动学模型,以及加工接触曲面模型得到接触式加工通用动力学模型; 第二步,构建基于多重约束的多级奖励函数,规划作业参数;包括: 构建基于加工任务约束的奖励函数: , 式中,d表示末端执行器与对应加工点的距离,k1,k2为第一、第二比例系数; 构建基于进给速度约束的奖励函数: , 式中,ve代表柔性磨盘进给速度的大小,k3表示速度约束受距离影响程度的比例系数,k4表示影响速度约束奖励值的比例系数; 构建基于进给角度约束的奖励函数: , 式中,表示磨盘进给方向与接触曲面主曲率之间的夹角,k5表示角度约束奖励值受距离影响程度的比例系数,k6表示影响角度约束奖励值的比例系数; 给出综合的奖励函数为: ; 第三步,基于接触式加工通用动力学模型设计基于双重Actor-Critic框架的算法结构,建立三重改进的双延迟深度确定性策略梯度网络;其中: 第一重改进包括:两个Q网络均为Actor-Critic网络: , 、分别代表两个Actor-Critic网络的有偏差的估计函数;、分别代表两个Actor-Critic网络的策略函数; 选取、两者之间的较小值作为估计函数估计量;表示折扣因子; 第二重改进包括:在学习过程中,使用目标网络作为函数逼近器对网络进行更新,Actor网络更新频率低于Critic网络; 第三重改进包括:引入正则化策略,将价值正则化至动作空间的一个区域内; 第四步,训练并加载所述三重改进的双延迟深度确定性策略梯度网络,对机器人进行运动轨迹规划,对接触式加工智能安全参数进行优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励