湖北大学彭菊红获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖北大学申请的专利一种基于元深度强化学习的网络信息年龄优化方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119135551B 。
龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411173954.2,技术领域涉及:H04L41/14;该发明授权一种基于元深度强化学习的网络信息年龄优化方法及系统是由彭菊红;高谦;罗显志;钟志峰;叶波设计研发完成,并于2024-08-23向国家知识产权局提交的专利申请。
本一种基于元深度强化学习的网络信息年龄优化方法及系统在说明书摘要公布了:本发明公开了一种基于元深度强化学习的网络信息年龄优化方法及系统。涉及无线网络通信技术领域,包括建立视频传输模型,收集当前状态数据、初始奖励信息与动作信息;通过元特征提取函数获取元特征,Actor策略网络结合当前策略与元特征获取下一步动作,发送回视频传输模型给出下一步状态数据与奖励信息,通过Critic价值网络评估Actor策略网络选择的下一步动作效果计算得到Actor策略网络策略梯度,同时更新Critic价值网络值函数,设置剪切概率比率机制,对网络进行策略梯度剪切;结合元学习算法动态更新网络参数。本发明提高了网络资源的整体利用率,减少了网络拥堵导致的数据传输失败和重新传输。
本发明授权一种基于元深度强化学习的网络信息年龄优化方法及系统在权利要求书中公布了:1.一种基于元深度强化学习的网络信息年龄优化方法,其特征在于,包括: 建立视频传输模型,收集所述视频传输模型的当前状态数据、初始奖励信息与动作信息; 通过元特征提取函数将所述当前状态数据映射到特征空间中,获取元特征,Actor策略网络结合当前策略与所述元特征获取下一步动作,将所述下一步动作发送回所述视频传输模型,所述视频传输模型给出下一步状态数据与下一步奖励信息,根据优势函数与目标值评估所述下一步动作的效果; 通过Critic价值网络评估Actor策略网络选择的所述下一步动作的效果计算得到Actor策略网络策略梯度,用于指导所述Actor策略网络更新信息,Critic价值网络基于所述下一步奖励信息与折扣因子更新Critic价值网络值函数,同时设置剪切概率比率机制,对Critic价值网络与Actor策略网络进行策略梯度剪切; 根据Critic价值网络值函数、Actor策略网络策略梯度与所述下一步奖励信息,结合元学习算法动态更新所述Critic价值网络与Actor策略网络的参数; 所述奖励信息基于奖励函数进行计算,奖励函数包括: 其中,n是传感器的索引,k是时间步,delay是从环境获得的当前视频块的延迟,sensor selection是当前选择的传感器; 如果某个传感器的信息年龄超过了设定的阈值,则认为发生了一次违规,I是指示函数,A_DIM是传感器的数量,如果年龄超过阈值则返回1,否则返回0;tau[n]是第n个传感器的年龄阈值; 定义一个多目标优化问题,目标是最小化视频传输的总延迟,最小化传感器的信息年龄,最小化违规次数,最小化重缓冲事件,最小化视频质量的突变并最大化视频的精度,将优化问题拆分为六个子问题,该问题通过以下数学表达式定义: Rtotal=Rdelay+Rage+Rquality+Rviolation+Rrebuffer+Rsmooth; 其中,Rdelay为延迟惩罚公式,Rage为信息年龄惩罚公式,Rquality为视频质量奖励公式,Rviolation为违规惩罚公式,Rrebuffer为重缓冲惩罚公式,Rsmooth为平滑切换惩罚公式; 加权总和标量化:每个目标乘以一个权重,然后所有加权目标求和: 其中,fix为第i个目标函数,wi为第i个目标函数的权重,x为决策变量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖北大学,其通讯地址为:430062 湖北省武汉市武昌区友谊大道368号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励