中科云谷科技有限公司童兴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科云谷科技有限公司申请的专利机器人配装训练方法、机器人配装控制方法和计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121424401B 。
龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202512018106.5,技术领域涉及:B25J9/16;该发明授权机器人配装训练方法、机器人配装控制方法和计算机可读存储介质是由童兴;王飞鸿;易作天;田曼伶设计研发完成,并于2025-12-30向国家知识产权局提交的专利申请。
本机器人配装训练方法、机器人配装控制方法和计算机可读存储介质在说明书摘要公布了:本申请实施例公开了一种机器人配装训练方法、机器人配装控制方法和计算机可读存储介质。其中,训练方法包括:构建初始智能体,基于初始智能体生成预设数量的关节状态组合;在模拟环境中,根据关节状态组合控制模拟机器人执行装配动作;确定奖励模式,基于奖励模式对执行的装配动作进行评分,得到奖励评分;利用奖励评分对初始智能体进行训练。控制方法包括:获取训练好的智能体;将获取的当前时刻的环境数据输入智能体中,对智能体进行调参,得到实施智能体;将任务指令输入实施智能体中,根据实施智能体输出的策略执行装配动作。因此,本申请能够有效提高装配机器人的适应性,能够在更多应用场景中准确完成装配动作。
本发明授权机器人配装训练方法、机器人配装控制方法和计算机可读存储介质在权利要求书中公布了:1.一种机器人配装训练方法,其特征在于,包括如下步骤: 构建初始智能体,基于所述初始智能体生成预设数量的关节状态组合; 在模拟环境中,根据所述关节状态组合控制模拟机器人执行装配动作; 确定奖励模式,基于所述奖励模式对执行的所述装配动作进行评分,得到奖励评分; 所述确定奖励模式,包括:获取所述初始智能体执行的任务信息;当所述任务信息符合复杂任务类型,且所述装配动作的步数大于预设步数阈值时,确定所述奖励模式为密集奖励模式;当所述任务信息符合简单任务类型,或所述装配动作的步数小于或等于预设步数阈值时,确定所述奖励模式为稀疏奖励模式; 当所述奖励模式为密集奖励模式时,所述基于所述奖励模式对执行的所述装配动作进行评分,包括:获取所述装配动作的实时位姿;确定所述实时位姿对应的实时坐标,获取目标工件的目标坐标;计算所述实时坐标与所述目标坐标之间的误差值,根据所述误差值确定距离奖励;根据预设的理想位姿和所述实时位姿,计算姿态偏差并确定成功奖励;获取执行所述装配动作的执行步数,根据所述执行步数确定步数奖励;确定执行所述装配动作过程中的超限状态次数,根据所述超限状态次数确定惩罚奖励;将所述距离奖励、所述成功奖励、所述步数奖励及所述惩罚奖励加权求和,生成所述密集奖励模式下的奖励评分; 当所述奖励模式为稀疏奖励模式时,所述基于所述奖励模式对执行的所述装配动作进行评分,包括:获取所述装配动作的末端位姿;根据所述末端位姿确定是否完成装配任务;若完成,则给予预设的奖励值;若未完成,不给予任何奖励;根据所述末端位姿确定是否符合预设的理想位姿;若不符合,则给予预设的惩罚值;若符合,则不给予惩罚值;将所述奖励值与所述惩罚值相加,生成稀疏奖励模式下的奖励评分; 利用所述奖励评分对所述初始智能体进行训练,迭代优化所述初始智能体至满足预设收敛条件; 将完成训练的初始智能体标记为智能体并输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科云谷科技有限公司,其通讯地址为:410000 湖南省长沙市高新开发区尖山路39号中电软件园一期10栋厂房401;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励