Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学王意洁获国家专利权

中国人民解放军国防科技大学王意洁获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学申请的专利基于强化学习分块的云际大模型推理任务调度方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120872536B

龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510988365.8,技术领域涉及:G06F9/48;该发明授权基于强化学习分块的云际大模型推理任务调度方法是由王意洁;包涵;孙崇翔;张凯鑫;阚浚晖设计研发完成,并于2025-07-17向国家知识产权局提交的专利申请。

基于强化学习分块的云际大模型推理任务调度方法在说明书摘要公布了:本发明公开了基于强化学习分块的云际大模型推理任务调度方法,目的是解决现有调度方法TBT和TTFT难以有效平衡的问题。技术方案是先构建由任务队列管理模块、实时状态采集模块、动态自适应预填充分块模块、调度模块组成的基于强化学习的自适应预填充分块的云际大模型推理任务调度系统;对调度系统进行训练,使得训练后的强化学习智能体能根据系统的任务状态和资源状态实时动态划分预填充分块;训练好的调度系统对云际任务进行调度时,根据系统的任务状态和资源状态实现预填充分块的尺寸自适应调整,且在对任务进行预填充的同时对已经完成预填充的任务进行解码,实现计算资源高效利用,使得TTFT‑TBT指标优化以及总运行时间降低。

本发明授权基于强化学习分块的云际大模型推理任务调度方法在权利要求书中公布了:1.一种基于强化学习分块的云际大模型推理任务调度方法,其特征在于包括以下步骤: 第一步,构建基于强化学习的自适应预填充分块的云际大模型推理任务调度系统; 基于强化学习的自适应预填充分块的云际大模型推理任务调度系统由任务队列管理模块、实时状态采集模块、动态自适应预填充分块模块、调度模块组成; 任务队列管理模块将任务状态初始化为等待状态,并将任务放置在等待队列中,同时将等待队列中W个任务提交至调度模块、实时状态采集模块; 实时状态采集模块在云际任务调度过程中监视任务特征和资源利用状态信息,将任务特征和资源利用状态信息传递给动态自适应预填充分块模块; 动态自适应预填充分块模块内有强化学习智能体,从实时状态采集模块接收任务特征和资源利用状态信息,根据任务特征和资源利用状态信息给出最优预填充分块大小,将最优预填充分块大小发送给调度模块;强化学习智能体是深度强化学习模型,由策略神经网络Actor、价值神经网络Critic组成; 调度模块是大语言模型,内含运行队列、已完成队列;调度模块对从任务队列管理模块接收的W个云际大模型推理任务按照最优预填充分块大小分割,分批次执行预填充;若W个任务中有完成预填充的任务,大语言模型对执行完预填充的任务进行解码,同时并行的对未完成预填充的Token子序列进行预填充;在预填充和解码的过程中,调度模块按照从动态自适应预填充分块模块接收到的新的适用于目前的任务特征和资源状态的最优预填充分块大小对任务的Token序列进行分割,并分批执行预填充; 第二步,对基于强化学习的自适应预填充分块的云际大模型推理任务调度系统中动态自适应预填充分块模块中的强化学习智能体进行训练,得到训练后的基于强化学习的自适应预填充分块的云际大模型推理任务调度系统,方法是:

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410073 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。