Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京师范大学斯白露获国家专利权

北京师范大学斯白露获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京师范大学申请的专利一种集群机器人躲避抓捕的强化学习方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115238870B

龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210932874.5,技术领域涉及:G06N3/092;该发明授权一种集群机器人躲避抓捕的强化学习方法及系统是由斯白露设计研发完成,并于2022-08-04向国家知识产权局提交的专利申请。

一种集群机器人躲避抓捕的强化学习方法及系统在说明书摘要公布了:本申请公开了一种集群机器人躲避抓捕的强化学习方法及系统。首先对集群中的个体进行初始化;通过贪婪策略确定目标集群中各个个体的当前时刻动作数据;建立动力学模型进行学习;具体通过低维度的输入学习周围个体数量的任务,通过扩充观察的维度,以学会聚集、防碰撞任务,进一步扩充观察维度,以学会躲避抓捕的任务。不断获取环境信息并执行动作,利用奖赏函数来更新策略网络,最终完成特定任务的学习。本发明借鉴了生物集群的运动模式以及学习方式,具有高度的仿生性。同时,该框架的学习不依赖于任何先验的行为规则以约束机器人的行为,而是让所有个体从最初始的随机状态开始学习,降低了人工依赖性,具有良好的鲁棒性与可扩展性。

本发明授权一种集群机器人躲避抓捕的强化学习方法及系统在权利要求书中公布了:1.一种集群机器人躲避抓捕的强化学习方法,其特征在于,所述方法包括: S1,获取目标集群,并对目标集群中的各个个体进行初始化;所述目标集群包括多个被捕机器人和一个捕猎机器人; S2,通过贪婪策略确定所述目标集群中各个个体的当前时刻动作数据;其中,所述动作包括个体的线加速度与转向角度; S3,建立所述被捕机器人与所述捕猎机器人的动力学模型;所述动力学模型包括三个子网络结构,其中第一子网络结构用于获取当前个体周围个体数量结果,第二子网络结构用于获取聚集及防碰撞结构,第三子网络结构用于获取躲避抓捕的相对位置结果; S4,遍历所述目标集群中的所有个体作为当前个体对所述第一子网络结构进行训练,具体使用q-learning对每个个体的策略网络进行更新; S5,确定所述当前个体的周围个体的网络数据,并将所述周围个体的网络数据与当前个体进行匹配进行合作学习; S6,更新所述贪婪策略中的概率参数,并开始执行进行下一周期的训练,直至达到预设的训练周期; S7,当达到预设的训练周期第一子网络收敛后,通过步骤S2到S5依次对第二子网络结构和第三子网络结构进行训练得到目标动力学模型,所述目标动力学模型用于得到集群机器人躲避抓捕结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京师范大学,其通讯地址为:100875 北京市海淀区新街口外大街19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。