成都信息工程大学黄占鳌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都信息工程大学申请的专利一种低计算资源下的气象预报大模型快速预报方法、系统、设备、介质及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120067600B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510526798.1,技术领域涉及:G06F18/20;该发明授权一种低计算资源下的气象预报大模型快速预报方法、系统、设备、介质及终端是由黄占鳌;方腾;肖伟;李孝杰;杨善敏;符颖;周峥;吴锡;黄小猛设计研发完成,并于2025-04-25向国家知识产权局提交的专利申请。
本一种低计算资源下的气象预报大模型快速预报方法、系统、设备、介质及终端在说明书摘要公布了:本发明属于气象预报技术领域,公开了一种低计算资源下的气象预报大模型快速预报方法、系统、设备、介质及终端。基于神经网络的微调技术、利用集成思想,针对现有大模型的大参数量训练对数据、计算资源要求高且训练难等问题,面向气象领域,设计一种低计算资源下的大模型快速预报方法,突破现有大模型训练的技术壁垒,实现低计算资源下从零开始快速预报出有效的大模型。本发明可实现低计算资源下的大模型快速预报,避免了现有大模型训练的高计算资源要求。本发明通过集成多种小模型的方式构成大模型,解决了现有大模型大参数量训练难的问题。本发明聚焦于气象领域的预报模型,对其他领域同样适用。
本发明授权一种低计算资源下的气象预报大模型快速预报方法、系统、设备、介质及终端在权利要求书中公布了:1.一种低计算资源下的气象预报大模型快速预报方法,其特征在于,包括以下步骤: 步骤1、构建气象预报大模型数据集; 步骤2、将气象预报大模型任务拆分为子任务1,子任务2,…,子任务N,确定子任务1-N的训练集; 步骤3、分解每一子任务输出,确定每一项子任务的子任务输出分支1,子任务输出分支2,…,子任务输出分支Q; 步骤4、针对子任务类型收集多种执行相同任务的小模型,构建小模型备选集; 步骤5、选择子任务类型N,初始化N为1; 步骤6、针对步骤5选择子任务类型N,对该项子任务输出分支1,训练小模型备选集中的每一个小模型,确定最优性能小模型作为基础模型; 步骤7、微调子任务N剩余输出分支上的小模型:在步骤6中基础模型上,子任务N的剩余输出分支采用与基础模型相同的小模型结构,以步骤6中训练好的基础模型的参数初始化子任务N剩余输出分支上的小模型参数,并进行参数微调; 步骤8、构建子任务N集成小模型:基于步骤6和步骤7中子任务N所有输出分支上训练好的小模型,采用相同小模型结构为子任务N集成小模型,将子任务N下所有输出分支的输出输入到子任务N集成小模型;以步骤6中基础模型的参数初始化子任务N集成小模型,并进行参数微调; 步骤9、更新子任务类型N=N+1,重复步骤5-8,训练当前子任务N集成模型; 步骤10、集成子任务N和N-1的集成模型输出,选择和步骤6中基础模型相同网络结构,以步骤6中的基础模型的参数初始化子任务N和N-1的集成小模型,微调子任务N和N-1的集成小模型参数; 步骤11、重复步骤9-10,直至所有子任务集成完成; 所述步骤5包含以下步骤: S51,选择子任务类型N,初始化N为1; 步骤6包含以下步骤: S61,选择子任务N输出分支1,从备选小模型集中选择一个小模型; S62,小模型训练配置,选择小模型的优化器,设置优化器的学习率、权重衰减系数、自适应矩估计参数; S63,根据选择子任务N的具体任务形式,确定子任务N的损失函数; S64,根据步骤3中S33,选择子任务N输出分支1对应的子任务N训练集1; S65,将S64中训练集输入到子任务N输出分支1的小模型中,以S63中确定的损失函数计算训练损失; S66,根据S65中的训练损失,执行反向传播算法获得子任务N输出分支1的小模型的参数更新梯度; S67,以S62中配置的优化器,更新子任务N输出分支1的小模型参数,直至S65中计算的损失变化平稳,保存训练过程中的最小损失以及对应子任务N输出分支1的小模型; S68,重复执行步骤S61-S67,选择具有最小损失的小模型,将该小模型作为子任务N的基础模型; 步骤7包含以下步骤: S71,依次选择子任务N的输出q分支,q=2,…Q; S72,选择步骤6中S68确定的基础模型为子任务N输出分支q的微调小模型; S73,微调子任务N输出分支q的小模型训练配置,选择子任务N输出分支q的小模型优化器,设置优化器的学习率、权重衰减系数、自适应矩估计参数; S74,根据选择子任务N输出分支q的任务类型,确定子任务N输出分支q的损失函数; S75,根据步骤3中S33,选择子任务N输出分支q对应的子任务N训练集q; S76,以步骤6中S68确定的基础模型参数初始化S72中子任务N输出分支q的小模型; S77,将S75中训练集输入到子任务N输出分支q的小模型中,以S74中确定的损失函数计算训练损失; S78,根据S77中的训练损失,执行反向传播算法获得子任务N输出分支q上的小模型的参数更新梯度; S79,以S73中配置的优化器,更新子任务N输出分支q上的小模型参数,直至S77中计算的损失变化平稳,保存训练过程中的最小损失以及对应最小损失下对应的小模型; S710,重复执行步骤S71-S79,直至子任务N上剩余所有输出分支的小模型训练完成; 步骤8包含以下步骤: S81,分别获取子任务N在步骤6中S68的基础模型,步骤7中S710中子任务N上剩余所有输出分支的小模型; S82,设置子任务N的集成小模型结构为基础模型; S83,选择子任务N的所有训练数据为S82中子任务N集成小模型的训练集; S84,选择子任务N集成小模型的优化器,设置优化器的学习率、权重衰减系数、自适应矩估计参数; S85,根据子任务N的任务类型,选择子任务N集成小模型损失函数; S86,以步骤6中S68确定的基础模型参数初始化S82中子任务N集成小模型; S87,将S83中训练集输入子任务N的输出分支1-Q,将输出分支1-Q上的小模型输出输入到子任务N集成小模型中,以S85中确定的损失函数计算训练损失; S88,根据S87中的训练损失,执行反向传播算法获得子任务N集成小模型的参数更新梯度; S89,以S84中配置的优化器,更新子任务N集成小模型参数,直至S87中计算的损失变化平稳,保存训练过程中的最小损失及对应子任务N集成小模型; 步骤9包含以下步骤: S91,更新子任务N类型,设置N=N+1; S92,重复步骤5-8,直至完成所有子任务的集成模块训练; 步骤10包含以下步骤: S1001,获取子任务N和N-1的集成模块; S1002,选择子任务N和N-1的集成小模型优化器,设置优化器的学习率、权重衰减系数、自适应矩估计参数; S1003,根据子任务N和N-1的任务类型,选择子任务N和N-1的集成小模型损失函数; S1004,以步骤6中S68确定的基础模型参数初始化S1002中子任务N和N-1的集成小模型; S1005,将S1002中训练集输入到子任务N和N-1集成模块中,子任务N和N-1集成模块输出输入到子任务N和N-1集成小模型中,以S1003中确定的损失函数计算训练损失; S1006,根据S1005中的训练损失,执行反向传播算法获得子任务N和N-1的集成小模型的参数更新梯度; S1007,以S1002中配置的优化器,更新子任务N和N-1的集成小模型参数,直至S1005中计算的损失变化平稳,保存训练过程中的最小损失及对应子任务N和N-1的集成小模型; 步骤11包含以下步骤: S1101,重复步骤9,保存剩余所有子任务的集成模块; S1102,更新子任务N类型,N=N+1; S1103,重复步骤10,完成子任务N和N-1的集成小模型训练; S1104,重复执行S1102-S1103,直至所有子任务集成小模型训练完成。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都信息工程大学,其通讯地址为:610225 四川省成都市西南航空港经济开发区学府路一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。