Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖大粤港澳大湾区创新研究院(广州增城)唐卓获国家专利权

湖大粤港澳大湾区创新研究院(广州增城)唐卓获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖大粤港澳大湾区创新研究院(广州增城)申请的专利一种基于算力网络的模型分布式训练方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119167093B

龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411376651.0,技术领域涉及:G06F18/214;该发明授权一种基于算力网络的模型分布式训练方法和系统是由唐卓;武博文;张嘉鹏;李军义;尹旦;陈长建;肖雄设计研发完成,并于2024-09-30向国家知识产权局提交的专利申请。

一种基于算力网络的模型分布式训练方法和系统在说明书摘要公布了:本发明公开了一种基于算力网络的模型分布式训练方法,包括:获取用户上传的模型信息及模型文件,获取数据集的信息,判断得到的模型信息中的模型名称是否存在于预先建立的字典中,如果不是则创建主进程,利用该主进程、并根据分布式调用服务请求中的模型名称与数据集名称分别从预先建立的模型仓库和数据集仓库中加载对应的模型与数据集;使用加载的数据集对模型进行分布式训练,以得到分布式训练后的模型,通过主进程将分布式训练后的模型保存到分布式训练结果仓库中。本发明能够解决现有分布式系统用户自己搭建的模型传播范围小的技术问题,以及对不匹配的模型与数据集进行分布式训练,造成计算资源浪费的技术问题。

本发明授权一种基于算力网络的模型分布式训练方法和系统在权利要求书中公布了:1.一种基于算力网络的模型分布式训练方法,其特征在于,包括以下步骤: 1获取用户上传的模型信息及模型文件; 2获取数据集的信息; 3判断步骤1得到的模型信息中的模型名称是否存在于预先建立的字典中,如果是,则从该字典获取该模型名称所对应的数据集名称列表,并转入步骤4,否则转入步骤5; 4判断步骤2得到的数据集的信息中的数据集名称是否存在于数据集名称列表中,如果是,则根据该数据集名称列表对应的模型名称和该数据集名称生成分布式训练服务请求,然后转入步骤5,否则转入步骤8; 5创建主进程,利用该主进程、并根据分布式调用服务请求中的模型名称与数据集名称分别从预先建立的模型仓库和数据集仓库中加载对应的模型与数据集;步骤5具体为,首先对分布式调用服务请求进行解析,以获取其中的模型名称和数据集名称,然后,利用python库中的importlib库加载存储在模型仓库中该模型名称对应的模型文件;最后,利用torchvision库中的datasets模块加载存储在数据集仓库中的该数据集名称所对应的数据集,若该数据集未存储在数据集仓库中,则利用datasets模块从开源深度学习框架pytorch提供的数据集源中将该数据集名称对应的数据集下载到数据集仓库中,再从数据集仓库中加载该数据集; 6使用步骤5加载的数据集对步骤5加载的模型进行分布式训练,以得到分布式训练后的模型;步骤6包括以下子步骤: 6-1通过主进程创建n个工作进程,对创建的n个工作进程进行随机编号,对步骤5加载的数据集进行划分处理,以得到多个子数据集,并对步骤5加载的模型先后进行全局保存和本地保存处理,以得到一个对应于主线程的全局模型、以及对应于n个工作线程的n个本地模型,其中n的取值范围是1到8; 6-2将步骤6-1得到的所有子数据集、1个全局模型和n个本地模型分配到对应的工作进程; 6-3每个工作进程根据其对应的子数据集和本地模型对步骤5加载的模型进行训练,以获取该工作进程当前周期的本地参数; 6-4每个工作进程等待其余所有工作进程都获取到了其当前周期的本地参数之后,将其当前周期的本地参数发送给全局模型; 6-5全局模型在接收到来自所有工作进程当前周期的本地参数后,对所有本地参数进行聚合,并利用聚合结果更新该全局模型的权重,以得到所有工作进程更新后的全局参数; 6-6每个工作进程在需要对本地模型进行训练前,利用步骤6-5得到的所有工作进程更新后的全局参数更新该工作进程的本地参数,并重复上述步骤6-2至步骤6-5,直到达到预设的迭代训练次数为止,从而得到分布式训练后的模型; 7通过主进程将步骤6得到的分布式训练后的模型保存到分布式训练结果仓库中,并判断是否能够得到分布式训练结果,如果是则过程结束,否则转入步骤8; 8重新获取数据集的信息,并返回步骤3。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖大粤港澳大湾区创新研究院(广州增城),其通讯地址为:511338 广东省广州市增城区新塘镇金融大道10号创悦孵化器A栋317室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。