山东海量信息技术研究院唐轶男获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东海量信息技术研究院申请的专利异构计算系统及故障处理方法、装置、设备、介质、产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121233404B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511794814.1,技术领域涉及:G06F11/20;该发明授权异构计算系统及故障处理方法、装置、设备、介质、产品是由唐轶男;王丽;李仁刚;赵雅倩;郭振华;曹芳;高开;王立设计研发完成,并于2025-12-02向国家知识产权局提交的专利申请。
本异构计算系统及故障处理方法、装置、设备、介质、产品在说明书摘要公布了:本发明公开了一种异构计算系统及故障处理方法、装置、设备、介质、产品,涉及异构计算技术领域。其中,方法包括当异构计算系统的源计算设备在执行推理请求任务过程中发生故障,获取推理请求任务的推理任务信息及异构计算系统的算力资源信息,并确定利用没有故障的计算设备继续执行剩余任务所需的任务预估时长,并从中选择任务预估时长最低的目标计算设备。将任务恢复请求发送至异构计算系统,异构计算系统将该推理请求任务迁移至目标计算设备继续执行。本发明可以解决相关技术无法合理处理故障并使得恢复后的推理请求任务尽快完成的问题,能够使恢复后的推理请求任务执行效率尽量高。
本发明授权异构计算系统及故障处理方法、装置、设备、介质、产品在权利要求书中公布了:1.一种故障处理方法,其特征在于,包括: 当异构计算系统的源计算设备在执行推理请求任务过程中发生故障,获取推理请求任务的推理任务信息及所述异构计算系统的算力资源信息; 根据所述推理任务信息和所述算力资源信息,确定利用所述异构计算系统中没有故障的计算设备,继续执行完所述推理请求任务的剩余任务所需的任务预估时长; 选择任务预估时长最低的目标计算设备,生成至少携带目标计算设备标识和任务迁移指示的任务恢复请求,并发送至所述异构计算系统,以将所述推理请求任务迁移至所述目标计算设备继续执行; 其中,所述源计算设备为执行所述推理请求任务的预填充阶段和解码阶段对应的计算设备,包括一个没有故障的计算设备;所述推理任务信息包括资源需求信息和源设备信息,所述算力资源信息包括故障监控信息及各计算设备的性能参数;将所述异构计算系统中不为所述源计算设备、不处于任务执行状态且处于正常状态的计算设备作为候选迁移设备; 根据所述故障监控信息和所述资源需求信息,确定各候选迁移设备及没有故障的源计算设备继续执行所述推理请求任务的任务恢复参数,所述任务恢复参数确定过程包括: 根据各计算设备的性能参数,确定源计算设备中的故障设备分别到各候选迁移设备及没有故障的源计算设备之间的网络带宽,根据故障监控信息确定检查点备份数据的数据量,并根据数据量和源计算设备分别到各候选迁移设备及没有故障的源计算设备之间的网络带宽,确定将推理请求任务从源计算设备分别迁移至各候选迁移设备及没有故障的源计算设备的迁移成本;根据资源需求信息,确定推理请求任务在预填充阶段和解码阶段转换过程中的待传输数据量,根据各计算设备的性能参数,确定各候选迁移设备及没有故障的源计算设备中任意两个计算设备之间的网络带宽,并根据待传输数据量,确定各候选迁移设备及没有故障的源计算设备中任意两个计算设备之间的数据传输成本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东海量信息技术研究院,其通讯地址为:250000 山东省济南市高新技术开发区国家信息通信国际创新园;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励