中国空间技术研究院刘爱冬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国空间技术研究院申请的专利一种基于深度强化学习的通信卫星多波束资源管控方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119727863B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411842784.2,技术领域涉及:H04B7/185;该发明授权一种基于深度强化学习的通信卫星多波束资源管控方法是由刘爱冬;刘慧梁;孟恩同;陈小群;孙茜;彭菲;李殷乔;刘乃金设计研发完成,并于2024-12-13向国家知识产权局提交的专利申请。
本一种基于深度强化学习的通信卫星多波束资源管控方法在说明书摘要公布了:一种基于深度强化学习的通信卫星多波束资源管控方法,属于卫星技术领域。本发明通过多智能体强化学习算法,能够动态调整和优化波束资源的分配策略。利用卫星天线跳波技术和时分复用方法,灵活应对地面用户需求和通信流量的变化,从而显著提高了星上链路的整体吞吐量。这种动态优化机制确保了资源的高效利用,提升了通信系统的传输速率和质量。
本发明授权一种基于深度强化学习的通信卫星多波束资源管控方法在权利要求书中公布了:1.一种基于深度强化学习的通信卫星多波束资源管控方法,其特征在于,包括: 步骤一,构建波束资源分配时间窗口、用户航天器、用户任务、不同轨道卫星及波束资源、可见时间窗口以及通信链路建立的数学模型,建立多波束卫星的通信及任务分配环境模型; 步骤二,根据所述多波束卫星的通信及任务分配环境模型,模拟星上任务的生成和传输,并根据模拟仿真的用户需求生成星上任务;调度资源以满足任务需求,并评估调度过程中的通讯任务吞吐量和时延; 步骤三,将步骤一和步骤二中的环境的观察值计算输入到高维观察向量,提取整体环境和任务的特征,建立卫星节点和资源之间的关系,对卫星节点‑资源特征进行处理,得到观察特征; 步骤四,构建多智能体合作强化学习的马尔可夫决策模型; 步骤五,将卫星节点信息、资源状况和任务需求作为强化学习的观察输入,通过编码器‑解码器处理特征向量,输入到所述马尔可夫决策模型中,输出智能体动作; 步骤六,训练马尔可夫决策模型中的策略网络,计算每个动作的优势函数进行反向传播,优化策略参数;在每个决策周期中,环境输入特征,策略网络输出动作及优势值,环境根据动作进行仿真模拟,网络进行反向传播更新权重参数,直至网络收敛;重复步骤二至六,直至达到预定的决策周期数或网络收敛;在每个决策周期结束后,记录和分析调度效果,优化资源分配策略; 所述马尔可夫决策模型,表示为六元组O,A,R,P,N,γ;其中,O为观察集合,A为动作集合,R为奖励集合,P为状态转移集合,N为智能体个数,γ为折扣因子; 定义局部观察空间、动作空间、奖励值空间、智能体集合、状态转移概率和奖励折扣因子;多智能优势分解采取信任分配混合网络及反事实基线的方法: 多智能体优势分解定理让智能体先后做出决策,使得每个智能体在做出决策时候获得前面智能体的决策信息,将多智能体联合策略优化转化为顺序策略搜索过程: 其中,Ai为智能体i的优势函数值,o为智能体i的观察,a为智能体动作,为智能体i的价值函数,b为反事实基线,n为智能体个数总和,m为当前智能体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国空间技术研究院,其通讯地址为:100094 北京市海淀区友谊路104号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励