中国科学院计算机网络信息中心王彦棡获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院计算机网络信息中心申请的专利一种面向国产超算系统的大模型并行训练策略生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119127477B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411144019.3,技术领域涉及:G06F9/50;该发明授权一种面向国产超算系统的大模型并行训练策略生成方法是由王彦棡;房晨;赵海杉;汪嘉恒;周纯葆;王珏;刘芳设计研发完成,并于2024-08-20向国家知识产权局提交的专利申请。
本一种面向国产超算系统的大模型并行训练策略生成方法在说明书摘要公布了:一种面向国产超算系统的大模型并行训练策略生成方法,并行训练策略包括并行训练方法、批尺寸、显存优化方法中的至少一种,并行训练策略构成搜索空间,该方法包括:获取生成并行训练策略所需的参数;基于参数,构建多个决策树,多个决策树用于分解并行训练策略的搜索空间,每个决策树用于表征并行策略的一个子搜索空间;基于决策树和参数,通过性能评估方法对模型训练方法进行评估,确定模型在不同的并行策略下的计算性能和通信性能;基于计算性能和通信性能,构建整数规划模型;确定整数规划模型的最优解,将最优解对应的并行训练策略作为确定的并行训练策略。本方法能够针对国产超算系统,生成最为方便快捷的大模型并行训练策略。
本发明授权一种面向国产超算系统的大模型并行训练策略生成方法在权利要求书中公布了:1.一种面向国产超算系统的大模型并行训练策略生成方法,其特征在于,并行训练策略包括并行训练方法、批尺寸BatchSize、显存优化方法中的至少一种,并行训练策略构成搜索空间,所述方法包括: 获取生成并行训练策略所需的参数; 基于所述参数,构建多个决策树,所述多个决策树用于分解并行训练策略的搜索空间,每个决策树用于表征所述并行训练策略的一个子搜索空间; 基于所述决策树和所述参数,通过性能评估方法对模型训练方法进行评估,确定模型在不同的并行训练策略下的计算性能和通信性能; 基于所述计算性能和所述通信性能,构建整数规划模型;所述整数规划模型中包括显存优化方法,所述显存优化方法包括重计算、零冗余和内存转移,所述整数规划模型的目标函数为 式中,表征并行训练策略i,表征计算时间,表征并行训练策略i是否使用重计算,且有,表征并行训练策略在使用重计算时的额外计算开销所增加时间,表征不使用显存优化方法时的并行训练策略i的前向计算时间和反向计算时间,包括显存密集型算子和访存密集型算子的执行时间,表征并行训练策略i是否使用等级三的零冗余优化技术,且有,表征使用等级三的零冗余优化技术时的额外通信开销所增加的时间,表征并行训练策略i是否使用内存转移,且有,表征内存转移的额外开销所增加的时间,表征不使用显存优化方法时并行训练策略i的通信时间; 确定所述整数规划模型的最优解,将所述最优解对应的并行训练策略作为确定的并行训练策略。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算机网络信息中心,其通讯地址为:100190 北京市海淀区中关村南四街4号院内2号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。