杭州电子科技大学卢从慧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学申请的专利一种基于TRPO算法的无人集群任务卸载方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119997267B 。
龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510111583.3,技术领域涉及:H04W84/18;该发明授权一种基于TRPO算法的无人集群任务卸载方法是由卢从慧;肖天勤;徐欣设计研发完成,并于2025-01-23向国家知识产权局提交的专利申请。
本一种基于TRPO算法的无人集群任务卸载方法在说明书摘要公布了:本发明涉及一种基于TRPO算法的无人集群任务卸载方法,步骤一:建立无人集群三层计算框架,监测地面设备的活跃状态并接收地面设备周期性产生的任务,根据工作量和最大可容忍延时将任务的信息表示为集合;步骤二:建立马尔可夫泊松调制的随机过程表示任务到达,定量分析模型内时变任务的服务延时;步骤三:构建系统的通信模型、延时模型、能耗模型;步骤四:引入多智能体马尔可夫决策过程描述S2的动态决策过程,智能体之间共享信息做出实时响应;步骤五:利用TRPO算法联合优化延时、能量,训练模型获得最佳卸载决策,采用最佳决策执行卸载。本发明有效提升了无人集群组网资源分配的公平性,延长了系统生命周期。
本发明授权一种基于TRPO算法的无人集群任务卸载方法在权利要求书中公布了:1.一种基于TRPO算法的无人集群任务卸载方法,其特征在于:包括以下步骤: 步骤一:建立无人集群三层计算框架,监测地面设备的活跃状态并接收地面设备周期性产生的任务,根据工作量和最大可容忍延时将任务的信息表示为集合; 步骤二:建立马尔可夫泊松调制的随机过程表示任务到达,定量分析模型内时变任务的服务延时; 步骤三:构建系统的通信模型、延时模型、能耗模型; 步骤四:引入多智能体马尔可夫决策过程描述S2的动态决策过程,智能体之间共享信息做出实时响应; 步骤五:利用TRPO算法联合优化延时、能量,训练模型获得最佳卸载决策,采用最佳决策执行卸载; 所述步骤五中对改进的多智能体TRPO算法进行训练包括如下步骤: S5.1:初始化状态s1,重置环境; S5.2:在满足最大回合数之前,每个智能体从环境获得观测ot,根据策略πθ'at|ot执行动作,得到及时奖励rt,观测新环境的状态st+1,将轨迹Trit={oit,ait,rit,sit+1}存储到缓冲池中,并计算每个状态的优势函数即 其中,Aiπ是策略π的优势函数,即在状态s下,动作a相对于平均动作的优势,Q表示状态动作值函数,V表示处于状态s时的值函数; S5.3:估计样本策略模型梯度,利用共轭梯度算法计算步长; S5.4:满足KL散度情况下,更新Actor网络参数θ; S5.5:优化价值网络参数φ以最小化回报和状态价值之间的均方误差,损失函数定义为: S5.6:进入分散执行阶段,在每个无人设备上独立地执行训练好的网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市钱塘区白杨街道2号大街1158号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励