Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军海军航空大学崔亚奇获国家专利权

中国人民解放军海军航空大学崔亚奇获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军海军航空大学申请的专利一种基于目标跟踪强化学习框架的目标跟踪强化学习方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115291204B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211059783.1,技术领域涉及:G01S13/66;该发明授权一种基于目标跟踪强化学习框架的目标跟踪强化学习方法是由崔亚奇;何友设计研发完成,并于2022-08-31向国家知识产权局提交的专利申请。

一种基于目标跟踪强化学习框架的目标跟踪强化学习方法在说明书摘要公布了:本发明实施例提供了一种目标跟踪强化学习框架,方法包括:目标跟踪强化学习框架中跟踪器、智能体、可执行动作空间、动作、状态、奖励以及环境的定义与设置;智能体与环境的交互方式,智能体控制策略的优化方式和智能体的运用方式;智能体优化后,智能体与环境交互,环境输出的跟踪器运动状态信息,作为目标跟踪强化学习方法的输出,各个时刻输出的跟踪器运动状态信息为强化学习方法所跟踪得到的目标航迹。本发明实施例提供了一种基于强化学习的目标跟踪框架,给出的智能体可基于模拟环境或者实际环境进行自我学习,具有适用范围广、适配场景多、人力物力消耗少等优点。

本发明授权一种基于目标跟踪强化学习框架的目标跟踪强化学习方法在权利要求书中公布了:1.一种基于目标跟踪强化学习框架的目标跟踪强化学习方法,其特征在于,包括以下步骤: 步骤1:目标跟踪强化学习框架中的跟踪器定义为具有所跟踪目标运动特性,受智能体控制和目标运动特性约束,在探测环境中运动的单元; 步骤2:目标跟踪强化学习框架中的智能体定义为跟踪器运动决策者,依据控制策略,控制跟踪器运动,其输入为环境提供的状态和奖励,输出为跟踪器应执行的动作,反馈给环境; 步骤3:目标跟踪强化学习框架中的可执行动作空间由跟踪器运动可控制参数变化空间构建,具体的动作从可执行动作空间中进行选取; 步骤4:目标跟踪强化学习框架中的状态为跟踪器当前时刻运动状态信息和探测设备获取的下一时刻量测信息,它们在统一惯性坐标系进行表示,其中探测设备输出的量测信息由多个量测点构成,每个量测点至少包含观测时间和空间位置信息,跟踪器运动状态信息至少包含时间、空间位置、运动速度和运动方向信息; 步骤5:目标跟踪强化学习框架中的奖励由同一时刻跟踪器运动状态信息与探测设备量测信息间距离的远近度量,两者越远,奖励越小,两者越近,奖励越大; 步骤6:目标跟踪强化学习框架中的环境由探测设备、探测环境和跟踪器共同构建,其输入为动作,输出为状态和奖励; 步骤7:目标跟踪强化学习框架中智能体与环境连续交互,一个完整的交互过程从环境初始状态开始,到环境终止状态结束,包括多步交互,在每步交互中,智能体接收环境输出的状态和奖励,依据控制策略,输出当前动作决策,环境接收智能体输出的当前动作,输出状态和奖励; 步骤8:目标跟踪强化学习框架中智能体的优化方式为以最大化累积奖励为目标,采用策略学习方法,通过智能体与环境交互,对智能体控制策略,进行不断优化学习,以得到满足要求的目标跟踪智能体; 步骤9:目标跟踪强化学习框架中智能体的运用方式为利用优化得到的目标跟踪智能体,进行智能体与环境的交互,每步交互,环境输出的跟踪器运动状态信息,作为目标跟踪强化学习方法的输出,各个时刻输出的跟踪器运动状态信息为强化学习方法所跟踪得到的目标航迹。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军海军航空大学,其通讯地址为:264001 山东省烟台市芝罘区二马路188号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。