西北工业大学黄攀峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于案例推理的机器人智能体技能学习与泛化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116992964B 。
龙图腾网通过国家知识产权局官网在2025-11-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310897598.8,技术领域涉及:G06N5/04;该发明授权一种基于案例推理的机器人智能体技能学习与泛化方法是由黄攀峰;王高照;刘星;刘正雄;马志强;常海涛设计研发完成,并于2023-07-20向国家知识产权局提交的专利申请。
本一种基于案例推理的机器人智能体技能学习与泛化方法在说明书摘要公布了:本发明涉及机器人智能体技能学习领域,具体涉及一种基于案例推理的机器人智能体技能学习与泛化方法,包括:构建案例库,获取案例库中与当前任务场景下的机器人智能体的每个状态向量最相似的目标案例,获取当前任务场景下的初始动作策略,获取目标动作策略,获取最终动作策略。本方法克服了使用深度神经网络拟合动作策略带来的动作策略可解释性低的问题,提高了机器人智能体的任务效率。
本发明授权一种基于案例推理的机器人智能体技能学习与泛化方法在权利要求书中公布了:1.一种基于案例推理的机器人智能体技能学习与泛化方法,该方法应用于移动机器人,其特征在于,包括: 将机器人智能体在已知任务场景下的动作策略中,每个时间步的机器人智能体的状态-动作对作为一个案例,并构建案例库; 获取当前任务场景与已知任务场景的状态向量之间的对应关系,以及动作向量之间的对应关系;根据所述状态向量之间的对应关系,获取案例库中与当前任务场景下的机器人智能体的每个状态向量最相似的一个目标案例; 根据当前任务场景下每个动作向量和状态向量,以及每个状态向量与对应的目标案例中的状态向量之间的对应关系,获取当前任务场景下的初始动作策略; 利用参数探索的策略梯度算法对初始动作策略进行优化,得到优化后的动作策略;利用随机探索方式对优化后的动作策略中的特征参数进行扩展,得到目标特征参数;获取目标特征参数的步骤包括:利用机器人智能体执行优化后的动作策略;直至机器人智能体的状态向量第一次到达预设的状态向量变化范围时,随机选取所述状态向量变化范围内的状态向量,作为机器人智能体此时的状态向量;根据此时的状态向量使用机器人智能体执行任务,并获取每次执行任务后的任务完成的奖励值;获取所有奖励值中的最大奖励值的轨迹对应的目标状态向量;将目标状态向量的向量大小作为目标特征参数; 根据目标特征参数和初始动作策略获取目标动作策略;利用参数探索的策略梯度算法对目标动作策略进行优化得到最终动作策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励