之江实验室唐哲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉之江实验室申请的专利异构集群的大模型训练的监控方法以及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120086097B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510571851.X,技术领域涉及:G06F11/30;该发明授权异构集群的大模型训练的监控方法以及电子设备是由唐哲;蔡润泽;张卫星;李海燕;陈群;崔鑫;杨非设计研发完成,并于2025-05-06向国家知识产权局提交的专利申请。
本异构集群的大模型训练的监控方法以及电子设备在说明书摘要公布了:本申请提供一种异构集群的大模型训练的监控方法以及电子设备。异构集群的大模型训练的监控方法包括:获取大模型在异构集群中处于启动状态的每台设备上的当次训练数据;根据当次训练数据,确定用于表征训练进程的当次性能数据;若当次性能数据未处于正常范围内,根据上次训练过程中的历史性能数据和当次性能数据,确定故障信息;根据故障信息,确定大模型训练是否发生异常,以监控大模型的训练过程。本申请可以监控大模型训练的训练过程,及时发现故障等异常情况。
本发明授权异构集群的大模型训练的监控方法以及电子设备在权利要求书中公布了:1.一种异构集群的大模型训练的监控方法,其特征在于,包括: 获取大模型在异构集群中处于启动状态的每台设备上的当次训练数据; 根据所述当次训练数据,确定用于表征训练进程的当次性能数据; 若所述当次性能数据未处于正常范围内,根据上次训练过程中的历史性能数据和所述当次性能数据,确定故障信息;其中,所述故障信息包括故障发现时长和故障恢复时长;根据本次训练开始时刻和上次训练结束时刻的差,确定所述故障发现时长;根据本次训练开始时刻和上次训练中的最后一次保存断点完成时刻的差,确定所述故障恢复时长; 根据所述故障信息,确定所述大模型训练是否发生异常,以监控所述大模型的训练过程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人之江实验室,其通讯地址为:311121 浙江省杭州市余杭区中泰街道科创大道之江实验室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。