西北工业大学刘星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利基于分层强化学习和大模型提示工程的人机协同任务规划方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120031319B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510124724.5,技术领域涉及:G06Q10/0631;该发明授权基于分层强化学习和大模型提示工程的人机协同任务规划方法是由刘星;张锦;黄攀峰;刘正雄;常海涛设计研发完成,并于2025-01-26向国家知识产权局提交的专利申请。
本基于分层强化学习和大模型提示工程的人机协同任务规划方法在说明书摘要公布了:本发明公开了基于分层强化学习和大模型提示工程的人机协同任务规划方法。该方法包括:当机器人在空间做在轨加注操作任务的场景下,设计在轨加注操作任务的实验流程,基于实验流程,设计状态矩阵和If‑then形式的规则;获取机器人对在轨加注操作任务的可执行基本动作,基于状态矩阵和可执行基本动作,得到状态转移模型;获取选项‑评论家架构中的策略函数且设置若干个回合;初始化策略函数,得到初始化后的策略函数;在第一个回合中,初始化状态矩阵,基于初始化后状态矩阵中的初始状态、初始化后的策略函数和状态转移模型,得到一条轨迹数据。本发明解决了现有技术中的人机协同规划任务,规划效率低的技术问题。
本发明授权基于分层强化学习和大模型提示工程的人机协同任务规划方法在权利要求书中公布了:1.基于分层强化学习和大模型提示工程的人机协同任务规划方法,其特征在于,包括: 当机器人在空间做在轨加注操作任务的场景下,设计在轨加注操作任务的实验流程,基于实验流程,设计状态矩阵和If-then形式的规则; 获取机器人对在轨加注操作任务的可执行基本动作,基于状态矩阵和可执行基本动作,得到状态转移模型; 所述状态矩阵包括:机器人在空间的位置信息、工具箱的位置信息、执行在轨加注操作任务的卫星的位置信息、机器人对于工具箱的四个工具的夹持信息和在轨加注操作任务的当前加注任务状态信息; 所述If-then形式的规则的确定过程为:基于用户经验知识对机器人在空间的在轨加注操作任务设计适用于强化学习方法的规则,得到If-then形式的规则; 获取选项-评论家架构中的策略函数且设置若干个回合; 初始化策略函数,得到初始化后的策略函数; 在第一个回合中,初始化状态矩阵,基于初始化后状态矩阵中的初始状态、初始化后的策略函数和状态转移模型,得到一条轨迹数据,其中,一条轨迹数据中包括:若干个状态、每个状态的动作和每个状态的塑造后奖励值,每个状态的塑造后奖励值是基于基础奖励值和附加奖励值确定的,附加奖励值是基于一条轨迹数据、If-then形式的规则和少样本思维链提示确定的大语言模型确定的; 所述得到一条轨迹数据,包括: 将初始化后状态矩阵中的初始状态输入初始化后的策略函数,得到初始状态对应的初始动作; 将初始状态和初始动作输入状态转移模型,得到第一状态和初始状态的塑造后奖励值; 将第一状态输入初始化后的策略函数,得到第一状态对应的第一动作; 将第一状态和第一动作输入至状态转移模型,得到第二状态和第一状态的塑造后奖励值,重复迭代,得到一条轨迹数据 基于第一回合中的一条轨迹数据,利用选项内的策略梯度定理更新第一回合中初始化后的策略函数; 在第二个回合中,初始化状态矩阵,基于初始化后状态矩阵中的初始状态、第一回合中更新后的策略函数和状态转移模型,得到一条轨迹数据,重复迭代,直到到达最后一个回合时,得到最后一个回合更新后的策略函数; 基于最后一个回合更新后的策略函数,控制机器人完成在空间做在轨加注操作任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市碑林区友谊西路127号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励