天津大学张秀云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种基于元强化学习的直升机多动态减振方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119203747B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411257065.4,技术领域涉及:G06F30/27;该发明授权一种基于元强化学习的直升机多动态减振方法是由张秀云;陈钰;宗群;杨昊设计研发完成,并于2024-09-09向国家知识产权局提交的专利申请。
本一种基于元强化学习的直升机多动态减振方法在说明书摘要公布了:本发明公开了一种基于元强化学习的直升机多动态减振方法,涉及直升机主动减振控制技术领域。本发明提供的一种基于元强化学习的直升机多动态减振方法,包括基于马尔可夫决策过程,将不同转速定义为不同任务层级,建立多动态直升机振动响应模型;基于策略扰动机制获得随机扰动策略,通过策略适应度评估策略的表现性能并更新策略,得到动态环境中振动控制的元策略学习算法;通过样本融合方法得到快速适应的数据集,并进行模型优化。因此,采用上述方法,能够实现对直升机振动控制策略的自主智能优化,确保在多动态飞行状态下的稳定性和有效性。
本发明授权一种基于元强化学习的直升机多动态减振方法在权利要求书中公布了:1.一种基于元强化学习的直升机多动态减振方法,其特征在于,包括以下步骤: S1、基于马尔可夫决策过程,建立多动态直升机振动响应模型,将不同的转速定义为不同任务,且在同一个马尔可夫决策过程中保持恒定; S2、基于策略扰动机制,获得动态环境中振动控制的元策略学习算法: 基于元策略,对各任务的初始策略赋值,利用策略适应度评价策略的性能,并通过策略扰动机制更新策略,包括: 针对相同转速环境,建立策略自适应学习的内循环框架: 在计算得到的策略适应度基础上,通过随机扰动得到随机策略; 将随机策略与变化环境交互获得样本剧集,并利用剧集质量、转速和前进比扩展样本;其中,样本剧集定义为从剧集开始到有条样本出现奖励函数时,则样本剧集结束重置环境并开始下一个样本剧集; 建立基于剧集质量的目标梯度函数,并通过梯度下降方法优化策略;其中,剧集质量被定义为: 式中,为样本剧集的奖励,为正则化常数,表示样本剧集中包含的具体样本条数; 针对不同转速环境,建立泛用性策略学习算法,利用优化策略参数更新元参数,获得最优元策略; S3、通过样本融合方法得到快速适应的数据集,并进行模型优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300072 天津市南开区卫津路92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。