Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京邮电大学彭涛获国家专利权

北京邮电大学彭涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京邮电大学申请的专利QoS约束下基于智能框架的高能效上行资源分配方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116133142B

龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211610515.4,技术领域涉及:H04W72/541;该发明授权QoS约束下基于智能框架的高能效上行资源分配方法是由彭涛;赵誉洁;郭异辰;牛怡静设计研发完成,并于2022-12-14向国家知识产权局提交的专利申请。

QoS约束下基于智能框架的高能效上行资源分配方法在说明书摘要公布了:本发明公开了QoS约束下一种基于智能框架的高能效上行资源分配方法。包括以下步骤:步骤1,能效定义;步骤2,能效优化;步骤3,定义系统有效能效;步骤4,智能框架描述;步骤5,RB分配的马尔科夫决策过程建模;步骤6,基于DDQN的RB分配;步骤7,基于分式规划的功率分配;本发明的有益效果是能够实现根据网络运行产生的巨量无线资源分配数据和无线测量数据,进行上行用户干扰建模,在获得的干扰模型的基础上进行联合资源分配,并且,本发明能够根据网络环境变化,实时地进行资源分配,在保证用户的QoS的情况下减少CCI并显著提高网络能效,能够减少训练时的网络波动,获得的干扰信息反映了网络的大尺度衰落情况,消除了小尺度衰落的影响。

本发明授权QoS约束下基于智能框架的高能效上行资源分配方法在权利要求书中公布了:1.QoS约束下一种基于智能框架的高能效上行资源分配方法,其特征在于,包括以下步骤: 步骤1,能效定义;分析UDN网络中能效的定义与计算; 设定ai表示用户ui∈U的服务基站,则通过RBnk∈N,基站ai接收到的用户ui信号的SINR表示为: 其中,为用户ui在RBnk上的传输功率,为RBnk上,用户ui到基站ai的信道增益,为分配指示变量,当RBnk分配给了用户ui,则否则σ2为加性高斯噪声功率,根据香农公式,用户ui在RBnk上的传输速率表示为: 其中,B为每个RB的带宽,用户ui的总传输速率表示为: 系统能效定义为系统总传输速率与总功耗的比值,表示为: 其中,pc,i是用户ui的固定电路功耗,μ是用户功率放大器效率的倒数,设定所有用户是相同的; 步骤2,能效优化; 将用户最低传输速率约束作为QoS,联合RB与功率分配最大化EE表示为: 其中,为RB分配矩阵,为功率分配矩阵,Uj代表由相同基站fj服务的用户集合,公式5表示用户ui的最大传输功率为 公式6表示用户传输功率是非负的,公式7表示RB分配变量只能取0或1,公式8表示同一小区内RB正交分配,一个RB在同一小区内只能分配给一个用户,公式9为QoS约束,要求用户最低传输速率为 步骤3,定义系统有效能效; 用于EE优化的新指标EEE定义为平均用户QoS满足率与系统EE的积,表示为: ηEEE=ηEE*ηsatisfaction……10, 用户QoS满足率定义为用户实际传输速率与要求的最低传输速率的比值,ηsatisfaction表示平均用户QoS满足率,表示为: EEE兼顾了用户QoS满足率与系统EE并被用于帮助网络训练且评估不同资源分配算法综合性能; 步骤4,智能框架描述; 设计一种智能框架用于资源分配,智能框架由无线网络、性能推测、联合资源分配三个模块组成,每部分功能如下: 无线网络模块:在无线网络运行过程中,产生很多无线数据,包括资源分配数据与网络测量数据,这些数据被收集并用于性能推测模块进行干扰建模,联合资源分配模块获得的资源分配方案在无线网络中被实施; 性能推测模块从无线网络模块获得无线数据,基于非线性回归的干扰建模方案进行干扰建模,获得干信比与噪信比信息,进而获得信道增益比相关信息:以及获得的干扰信息用于帮助资源分配,在训练RL智能体时,评估当前动作的奖励并预测未来不同动作的奖励,在功率分配中作为已知信息求解最优分配; 联合资源分配模块中部署了资源分配算法,包括两个部分:基于强化学习的RB分配与基于分式规划的功率分配且两者不断交互,当开始资源分配时,首先在RB分配部分一个一个分配RB,每当分配完一个RB,对所有已分配的RB上执行功率分配,功率分配模块将从RB分配模块得到当前的RB分配状态,并将获得的最大化用户QoS满足率的功率分配方案传递回去,RB分配部分根据当前用户QoS的满足率分配下一个RB并持续到所有RB分配完毕,功率分配的结果被用于训练RL网络,最终,获得的资源分配方案在无线网络模块中部署; 步骤5,RB分配的马尔科夫决策过程建模; 步骤6,基于DDQN的RB分配; 采用DDQN即一种RL方法解决马尔科夫决策过程,DDQN中包含两个网络:当前Q网络与目标Q网络,网络输入层神经元数目为3|F|+|U|,为状态维度,输出神经元数目为3|F|,等于动作数,隐藏层有一个,其神经元数目为64,在开始训练前,当前Q网络的参数为随机初始化,目标Q网络使用与之相同的随机化参数,经验池D为空,初始状态设为RB未分配给任何用户,可执行动作集合A′初始化为A,设置训练时长为200传输时间间隔,每个TTI将对所有资源重新分配,对于每一个RB,t时刻求解包括以下步骤: 步骤6.1,选择动作,观察当前状态st,当RB还未分配给任何用户,同时有用户还未满足QoS,则随机选择一个不满足用户并为其分配当前RB,否则根据∈-贪婪策略选择动作at,如以下公式所示: randomA′代表从集合A′中随机选择一个元素,θ是网络参数,c~U[0,1],∈∈0,1为随机选择动作的概率,满足其中∈max、∈min分别代表∈的最大值与最小值,T为总时间; 步骤6.2,执行上一步所选的动作at,智能体状态转移到st+1,并获得即时奖励rt+1,对于与动作at相关的基站,将与其相关的所有动作从A′中删除; 步骤6.3,更新经验池,将新的经验样本st,at,st+1,rt+1放入经验池; 步骤6.4,更新策略,每隔T1个时刻,随机从经验池中选择一个Mini-batch大小的样本集合,采用梯度下降法更新当前Q网络参数,每隔T2时刻,使用当前Q网络参数更新目标Q网络参数; 步骤7,基于分式规划的功率分配; 每分配完第k′个RB,将基于获得的k′个RB的分配方案重新进行功率分配,优化每个RB上的能效并将最低速率要求等分到用户使用的所有RB上以降低复杂度,设定每个用户在每个RB上的最大传输功率相同,将RBnk上的功率分配最大化能效问题P2表示为: 其中, 定义为是用户ui在RBnk上的最大传输功率,相应的,定义是用户ui在RBnk上的最低传输速率,Ni是用户ui分配的RB数,使用上述定义,同时使用干扰识别信息,能够重新表示为: 则能够表示为: 公式28、公式29中存在分式,公式28和公式29是非凸的,则问题P2的优化目标即公式24,是非凸的,公式28的分式满足分子是凹的,分母是凸的,使用分式规划方法,固定并引入辅助变量如以下公式所示: 固定将公式28重新表示为: 每个用户ui对应一个辅助变量所有辅助变量组成集合将上式代入公式29,则公式29也会满足分子凹,分母凸的条件,继续采用分式规划,固定与Zk,引入辅助变量yk,如以下公式所示: 固定yk与Zk,将公式29变形为: 同理,非凸的公式27用相同的方式转为凸形式,则问题P2转化为如下问题P3,如以下公式所示: s.t.公式25公式26 上述问题是一个凸问题并用软件包求解,求解问题P2需要求解问题P3; 所述步骤5包括以下步骤: 步骤5.1,RB分配问题描述:一个一个分配RB并且在每个RB上单独优化能效以降低复杂度,在RB分配时假设用户的传输功率由开环功率控制方法决定,则RBnk分配问题描述为: 其中, 是RBnk上的能效,公式15表示在前k个RB上满足用户的QoS,当分配RBnk时,RBnk′,k′k已经分配完毕,即xk′,k′k是已知的; 步骤5.2,将RB分配问题建模为一个马尔科夫决策过程,在RB分配问题中,设定中央控制器为智能体且与无线环境不断交互,马尔科夫决策过程对应的四元组S,A,P,R中的元素定义如下: S:表示状态集合,智能体在时刻t的状态被设定为由与两部分组成,如以下公式所示: 第一部分状态为不同动作对应的奖励预测值,表示为:|A|代表的是动作数,在每个时刻,不是所有动作都是能够执行的,则对应动作a的奖励值定义为: 其中,是动作a执行后能够获得的奖励的预测值,β是一个负值,由于兼顾了QoS,第二部分状态定义为所有用户的QoS不满足率:ρt,i代表用户ui的QoS不满足率,即1减去用户ui的满足率,如以下公式所示: 其中,Rt,i为用户ui在时刻t的传输速率,为用户ui的最低传输速率; a表示智能体的动作集合,包括所有的RB分配动作,对于当前被分配的RB,考虑两种动作,第一种是基站fj将当前RB分配给其服务用户ui使用,表示为动作第二种是基站fj将当前RB不分配给其任何服务用户,用动作表示,动作集合能够表示为: 在开始分配某一个RB时,当有用户的QoS没有满足,首先随机选择其中一个分配当前RB,在每个时刻,当某个基站之前已经选择了当前RB的分配动作,则与其相关的分配动作之后不再被选择,当与某个基站相关联的用户中部分用户满足了QoS则基站将RB分配给未满足QoS的用户; P:表示状态转移概率函数,在当前场景下,智能体选择某个执行动作后转到确定的状态; R:表示奖励函数,观察问题P1的目标与约束,奖励函数既反映用户的QoS情况又反映系统能效大小,采用动作执行前后EEE的改变量来评估t时刻选择的动作的优劣,如以下公式所示: rt=ηt,EEE-ηt-1,EEE……20, 其中,ηt,EEE表示t时刻的系统EEE,性能推测模块建立的干扰模型将构建一个虚拟网络代替无线网络与智能体交互,根据干扰信息的形式,在性能推测模块计算并反馈奖励时,将SINR计算式重新表达为: 所述步骤7中,问题P3求解对应的算法包括以下步骤: 步骤7.1,初始化为任意可行值,初始化迭代计数变量m=1,以及最大迭代次数M; 步骤7.2,根据公式30更新Zk; 步骤7.3,根据公式32更新yk; 步骤7.4,固定Zk、yk,通过求解凸优化问题P3更新 步骤7.5,更新m:m=m+1; 步骤7.6,判断优化目标公式34是否收敛,判断m是否满足mM,当两者满足其一,结束迭代,否则返回步骤7.2。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京邮电大学,其通讯地址为:100876 北京市海淀区西土城路10号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。