Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 江南大学吴琼获国家专利权

江南大学吴琼获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉江南大学申请的专利一种基于异步联邦和深度强化学习的协作边缘缓存方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115297170B

龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210680654.8,技术领域涉及:H04L67/568;该发明授权一种基于异步联邦和深度强化学习的协作边缘缓存方法是由吴琼;赵宇设计研发完成,并于2022-06-16向国家知识产权局提交的专利申请。

一种基于异步联邦和深度强化学习的协作边缘缓存方法在说明书摘要公布了:本发明公开了一种基于异步联邦和深度强化学习的协作边缘缓存方法,该方法首先使用异步联邦学习框架进行边缘内容缓存,可以使车辆用户的数据都在本地训练从而降低车辆用户的隐私风险,降低通信成本,适应高度动态的车辆网络环境,其次,使用自动编码器模型预测内容流行度,每个车辆用户使用基于自动编码器的内容流行度预测算法从车辆用户历史请求内容和上下文信息学习数据中潜在的相关性,从而提高每个边缘设备的缓存性能,最后,使用duelingDQN强化学习算法来学习每个边缘设备中车辆用户的请求内容数据,基于自动编码器模型预测出来的内容流行度,duelingDQN可以做出最优的缓存决策,降低车辆平均请求时延和提高每个边缘设备的缓存性能。

本发明授权一种基于异步联邦和深度强化学习的协作边缘缓存方法在权利要求书中公布了:1.一种基于异步联邦和深度强化学习的协作边缘缓存方法,其特征在于,该方法使用的通信网络架构为:最高层为核心网络和宏基站MBS,中间层包括多个路侧单元RSU,其作为边缘服务器缓存内容,底层包括车辆和车辆请求内容,该方法包括以下步骤: 1RSU覆盖范围内包含有多个车辆,计算每轮通信回合中基于车辆速度的运动模型,在所述运动模型中,所有车辆朝着同一个方向行驶,车辆行驶通过不同RSU的覆盖范围时,车辆在当前时刻连接与其通信的RSU后,移交给下一个相邻的RSU; 2依据某通信回合中每辆车的信道增益得到在某时刻RSU与其覆盖范围内的移动车辆的无线传输速率,所述移动车辆由MBS提供服务; 3车辆获取请求内容,从而得到某通信回合中所有车辆的内容请求时延,并依据所述请求时延描述协作缓存策略问题;车辆获取请求内容的方法为:如果车辆请求的内容缓存在本地的RSU中,则本地RSU直接将内容传递给车辆;如果车辆请求的内容没有缓存在本地的RSU,则车辆从其他相邻的RSU获取请求内容;如果请求的内容没有缓存在本地RSU和相邻RSUs,车辆从MBS获取请求内容; 4应用异步联邦学习框架来聚合在高度动态的车联网环境下来自每个车辆的本地模型,从而得到全局模型,经过多次迭代训练出高效收敛的全局模型; 5利用全局模型对各个车辆用户的流行内容进行预测,并进行聚合比较,得到内容流行度最高的多个内容; 6采用duelingDQN解决协作缓存策略问题并确定将流行度最高的多个内容中的哪些内容主动缓存在适当的RSU中,确定将流行度最高的多个内容中的哪些内容主动缓存在适当的RSU中的方法为: 在DQN基础上,duelingDQN将action-state值函数Q分解为状态值函数V和动作优势函数A,形成duelingDQN神经网络,状态值函数V与动作无关,动作优势函数A与动作有关,它是在状态st下执行动作at来解决奖励偏差问题的平均回报,动作Q-value函数写成: Qst,at;θ=Vst;θ+Ast,at;θ 其中,θ为duelingDQN的神经网络参数,动作优势通常被设置为单个动作优势函数减去特定状态下所有动作优势函数的平均值,动作Q-value函数计算如下: 因此,使用duelingDQN来解决内容缓存问题,状态空间、动作空间和奖励函数描述如下: 状态空间st:状态空间st被定义为st=s1,s2,...,sc,在这里st代表本地RSU缓存的具体内容,c是RSU的缓存容量; 动作空间at:动作空间代表是否需要替换RSU中的缓存内容,那些没有缓存在本地RSU的流行内容服从集合κ,如果at=1,将从集合κ中随机选择kkc内容并且交换缓存在本地RSU的索引最低的k个内容,然后再基于内容流行度对状态空间的内容索引进行降序排序,得到st+1,这样一来可以确保在时间t,在本地RSU中被替换的内容是最不流行的内容,at=0代表在本地RSU缓存的内容不会被替换; 奖励函数rt:当本地RSU缓存状态是st,执行完动作at后将获得奖励函数rt;为了最小化总的内容请求时延和系统奖励,设计了奖励函数如下: 是在时间t,车辆Vi r请求内容f的奖励; λ1+λ2+λ3=1,λ1<λ2≤λ3,是车辆从本地RSU获得请求内容f的奖励;是车辆从相邻RSU获得请求内容f的奖励;是车辆从MBS获得请求内容f的奖励,RSU根据本地内容流行度和车辆的请求内容信息,通过最大化奖励函数rt来优化缓存策略π*。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江南大学,其通讯地址为:214000 江苏省无锡市蠡湖大道1800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。