东南大学东方获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于动态深度神经网络的模型缓存和请求路由方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119342536B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411348486.8,技术领域涉及:H04W28/14;该发明授权一种基于动态深度神经网络的模型缓存和请求路由方法与系统是由东方;丘淑婷;谭思雨设计研发完成,并于2024-09-26向国家知识产权局提交的专利申请。
本一种基于动态深度神经网络的模型缓存和请求路由方法与系统在说明书摘要公布了:本发明公开一种基于动态深度神经网络的模型缓存和请求路由方法与系统,首先根据深度神经网络在不同分支出口的推理精度将其划分成多个不同的子模型,统计这些子模型的浮点计算量和内存占用大小;然后以最大化用户请求的总推理精度为目标,在延迟和资源等约束下建立目标优化式,根据已知的用户请求,利用线性规划方法求解目标优化式以得到最优的模型缓存和请求路由分数解;利用随机舍入的方法将模型缓存和请求路由分数解舍入为整数解;最后利用启发式的方法将随机舍入得到的模型缓存和请求路由的解转化为最终满足所有约束的可行解。本发明能够在保证较低时延的基础上提高用户请求的推理精度,满足边缘智能应用高精度与低延迟的需求。
本发明授权一种基于动态深度神经网络的模型缓存和请求路由方法与系统在权利要求书中公布了:1.一种基于动态深度神经网络的模型缓存和请求路由方法,其特征在于,包括如下步骤: 步骤1,在已有的数据集上,分析深度神经网络模型各层的输出特征图用于计算分类任务所获得的推理精度,对各层分支出口的浮点计算量和内存占用大小进行量化表示,将深度神经网络模型划分成多个具有不同推理精度和不同大小的子模型; 步骤2,获取当前观察窗口的用户请求序列以及上一个观察窗口的缓存状态,基于步骤1所划分的不同大小的子模型,在已知用户所请求的深度神经网络模型的基础上,使用线性规划方法在满足约束的条件下求解效益最大化的模型缓存和请求路由联合优化问题的解;所述效益为用户请求的总推理精度,所述约束包括:每个基站缓存每个深度神经网络模型的一个子模型,每个用户请求最多被路由到一个基站,基站上所缓存的子模型用于推理用户请求之前必须被完整加载到内存中,以及基站的内存容量和用户最大可容忍感知延迟约束; 步骤3,对于步骤2所得到的最优分数解,利用随机舍入方法将其舍入为整数解; 步骤4,对于步骤3所得到的舍入后的模型缓存和请求路由整数解,利用启发式方法得到最终的模型缓存和请求路由可行解。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励