Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国人民解放军国防科技大学李荣春获国家专利权

中国人民解放军国防科技大学李荣春获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国人民解放军国防科技大学申请的专利无模型强化学习算法的分布式数据处理方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119903895B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510082755.9,技术领域涉及:G06N3/092;该发明授权无模型强化学习算法的分布式数据处理方法、设备及介质是由李荣春;卢霈麟;卢凯;李东升;李瑞涵;贺周雨;乔鹏设计研发完成,并于2025-01-20向国家知识产权局提交的专利申请。

无模型强化学习算法的分布式数据处理方法、设备及介质在说明书摘要公布了:本申请涉及无模型强化学习算法的分布式数据处理方法、设备及介质,首先根据强化学习算法训练过程中的任务类型,封装不同任务级别的角色,然后定义各角色之间的通信拓扑结构,实现分布式通信模式的基本计算单元组,进而对基本计算单元组进行扩展,根据选定的聚合、分发策略,预设模型的聚合和分发方式,最后根据既定规则进行全局参数自适应适配和任务调度,直至训练完毕。其将单一算法训练拓展演变至大规模分布式训练,从原来单一的串行计算,通过分离计算组件,抽象为任务角色单独计算,通过角色任务分工以及拓展角色数量达到快速积累以及探索样本的目的,并将各训练任务并行执行,能够大幅提高整体样本生产和训练效率。

本发明授权无模型强化学习算法的分布式数据处理方法、设备及介质在权利要求书中公布了:1.一种面向调度无模型强化学习算法的分布式数据处理方法,其特征在于,所述方法包括: S1:根据强化学习算法训练过程中的任务类型,封装为不同任务级别的角色; S2:基于角色的不同任务级别,定义相互之间的通信拓扑结构,实现分布式通信模式的基本计算单元组; S3:扩展基本计算单元组,并根据选定的聚合、分发策略,预设模型的聚合和分发方式; S4:根据封装的角色、基本计算单元组、以及预设模型的聚合和分发方式,进行全局参数自适应适配和任务调度,直至训练完毕; 基于通信协议: 在邻式策略中,每个学习器的模型发送接口和模型接收接口,分别与其相邻学习器的模型接收接口和模型发送接口连接;将其模型发送给它相邻的学习器,聚合也只聚合相邻的学习器的模型; 或,在环状策略中,每个学习器的模型发送接口和模型接收接口,分别与其下一位置的学习器的模型接收接口和模型发送接口连接;将其模型发送给它下一个位置的学习器,最后的通信结构呈现一个环状; 或,在稠密策略中,每个学习器的模型发送接口和模型接收接口,与除自身的所有学习器的模型接收接口和模型发送接口连接;将其模型发送给其余所有学习器,并接收其余所有学习器的模型; 或,在权重策略中,每个学习器评估与自身当前模型优益权重最高的学习器,其模型发送接口和模型接收接口与其优益权重最高的学习器的模型接收接口和模型发送接口连接,以将其模型发送给与其优益权重最高的学习器,并接收与其优益权重最高的学习器的模型,聚合时根据权重进行聚合; 步骤S4,包括: S41:启动训练前,对全局参数进行一次预演,初始化算法参数、环境参数和调度参数,构建训练任务; S42:根据封装的角色、基本计算单元组、以及预设模型的聚合和分发方式,进行一次数据流的通信交换,计算各角色间、基本计算单元组间和模型的基本参数,以确定最佳参数; S43:根据最佳参数,进行训练任务;各训练任务根据封装的角色、基本计算单元组、以及预设模型的聚合和分发方式并行执行,直至训练完毕; 基本参数,包括角色间、组别间的数据吞吐量、样本吞吐量、通信消耗、模型的flops、参数量、样本量的理论最大限度、各单元操作均时的任意一个或多个。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410005 湖南省长沙市开福区砚瓦池正街47号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。