Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 武汉科技大学陈晨获国家专利权

武汉科技大学陈晨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉武汉科技大学申请的专利基于改进SAC强化学习的机器人恒力打磨控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119758877B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411992311.0,技术领域涉及:G05B19/4097;该发明授权基于改进SAC强化学习的机器人恒力打磨控制方法及系统是由陈晨;薛家兴;段现银设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。

基于改进SAC强化学习的机器人恒力打磨控制方法及系统在说明书摘要公布了:本申请属于自动化控制技术领域,具体公开了基于改进SAC强化学习的机器人恒力打磨控制方法及系统,其中方法包括:在MuJoCo平台上建立打磨机器人的接触仿真模型;对打磨机器人恒力打磨的控制过程进行马尔科夫决策过程建模,设定状态空间、动作空间和奖励函数,建立机器人恒力打磨控制模型;构建基于位置的阻抗控制器,基于阻抗控制器控制打磨机器人进行恒力打磨;阻抗控制器包括未知的阻抗参数,阻抗参数包括比例系数和积分系数;基于改进SAC强化学习求解阻抗控制器中的阻抗参数,确定打磨机器人的最优控制策略,并基于最优控制策略实现打磨机器人的恒力打磨控制。本申请对于连续状态和动作空间的机器人恒力打磨控制这一场景具有更好的性能表现。

本发明授权基于改进SAC强化学习的机器人恒力打磨控制方法及系统在权利要求书中公布了:1.一种基于改进SAC强化学习的机器人恒力打磨控制方法,其特征在于,包括: 在MuJoCo平台上建立打磨机器人的接触仿真模型; 对打磨机器人恒力打磨的控制过程进行马尔科夫决策过程建模,设定状态空间、动作空间和奖励函数,建立机器人恒力打磨控制模型; 构建基于位置的阻抗控制器,基于所述阻抗控制器控制打磨机器人进行恒力打磨;所述阻抗控制器包括未知的阻抗参数,所述阻抗参数包括比例系数和积分系数;所述基于位置的阻抗控制器的阻抗方程为: 其中,为惯性系数,为阻尼系数,为刚度系数,为机器人末端实际位置与期望位置的位置误差,与分别为的一阶导数和二阶导数,为实际接触力与期望接触力的力误差,为比例系数,为积分系数;基于改进SAC强化学习求解所述阻抗控制器中的阻抗参数,确定打磨机器人的最优控制策略,并基于所述最优控制策略实现打磨机器人的恒力打磨控制; 所述改进SAC强化学习的网络结构包括actor网络和critic网络,所述基于改进SAC强化学习求解所述阻抗控制器中的阻抗参数,包括: 对于当前学习序列中的每个控制步,通过RELS进行环境参数估计,所述环境参数包括环境刚度和环境位置; 基于估计的环境参数,预设的期望接触力和初始运动轨迹,调整打磨机器人的参考运动轨迹; 控制打磨机器人沿着所述参考运动轨迹进行运动,获取机器人末端的实际接触力,并计算所述实际接触力和所述期望接触力之间的力误差; 基于actor网络选择末端补偿量作为强化学习当前时刻的动作 基于所述力误差计算所述阻抗参数的调整量并应用于所述阻抗控制器; 基于调整后的阻抗参数确定机器人的关节位移指令; 基于所述奖励函数计算强化学习当前时刻的奖励值,基于critic网络确定新状态,收集数据元组并存储至经验回放池; 每n个控制步从所述经验回放池中采样数据进行actor网络和critic网络的更新; 当完成当前学习序列后,评估SAC的平均奖励和表现,以监控学习进度; 当达到最大学习序列数或SAC收敛后,输出训练好的actor网络以进行阻抗控制; 采用非线性跟踪微分器进行打磨机器人冲击阶段的力规划; 通过RELS进行环境刚度的初始估计,设定所述阻抗控制器中的初始参数,所述初始参数包括惯性系数、刚度系数和阻尼系数; 设定打磨机器人智能体与环境交互的最大学习序列数、每个学习序列中的最大控制步数,设定打磨机器人智能体的的初始运动轨迹和期望接触力,初始化改进SAC强化学习的actor网络、critic网络和经验回放池; 所述奖励函数满足: 其中,为奖励函数,、、和均为常数,为实际接触力与期望接触力的误差,为机器人末端速度;为当前策略选择的动作熵,为温度系数,为比例系数,为强化学习当前时刻的动作空间,为强化学习当前时刻的状态空间,为强化学习的当前策略。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉科技大学,其通讯地址为:430081 湖北省武汉市青山区和平大道947号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。