苏州元脑智能科技有限公司;浪潮电子信息产业股份有限公司唐轶男获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司;浪潮电子信息产业股份有限公司申请的专利任务分配方法、装置及设备、存储介质和计算机程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120762926B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511293184.X,技术领域涉及:G06F9/50;该发明授权任务分配方法、装置及设备、存储介质和计算机程序产品是由唐轶男;李仁刚;赵雅倩;郭振华;王丽;曹芳;高开;王立设计研发完成,并于2025-09-11向国家知识产权局提交的专利申请。
本任务分配方法、装置及设备、存储介质和计算机程序产品在说明书摘要公布了:本申请公开了一种任务分配方法、装置及设备、存储介质和计算机程序产品,涉及计算机技术领域,该方法包括:获取第一预设时间段内的推理任务信息以及异构计算系统中各计算卡的算力信息;基于推理任务信息预测第二预设时间段内接收到的推理请求的预测数量;根据推理任务信息、各计算卡的算力信息和预测数量为各计算卡分配预填充任务或解码任务,并确定为各计算卡分配的任务数量,以使异构计算系统响应预测数量的推理请求的时间最短。本申请实现了异构资源与推理任务的最优匹配,提高异构资源的利用率,提高推理任务的执行效率。
本发明授权任务分配方法、装置及设备、存储介质和计算机程序产品在权利要求书中公布了:1.一种任务分配方法,其特征在于,包括: 获取第一预设时间段内的推理任务信息以及异构计算系统中各计算卡的算力信息; 基于所述推理任务信息预测第二预设时间段内接收到的推理请求的预测数量; 根据所述推理任务信息、各计算卡的算力信息和所述预测数量为各计算卡分配预填充任务或解码任务,并确定为各计算卡分配的任务数量,以使所述异构计算系统响应所述预测数量的推理请求的时间最短; 其中,根据所述推理任务信息、各计算卡的算力信息和所述预测数量为各计算卡分配预填充任务或解码任务,并确定为各计算卡分配的任务数量,以使所述异构计算系统响应所述预测数量的推理请求的时间最短,包括: 根据每个预填充任务的平均计算量、每个解码任务的平均数据访存量、各计算卡的计算性能、输入输出带宽和所述预测数量为各计算卡分配预填充任务或解码任务,并确定为各计算卡分配的任务数量,以使能量参数最小; 其中,所述能量参数为第一中间参数与第二中间参数之和,所述第一中间参数为预填充任务响应时间与解码任务响应时间的差值的绝对值,所述第二中间参数为所述预填充任务响应时间与所述解码任务响应时间中的最大值,所述预填充任务响应时间为预填充计算卡集合中各预填充计算卡执行对应任务数量的预填充任务的时间的最大值,所述解码任务响应时间为解码计算卡集合中各解码计算卡执行对应任务数量的解码任务的时间的最大值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司;浪潮电子信息产业股份有限公司,其通讯地址为:215100 江苏省苏州市吴中经济开发区综保区经一路1号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励