苏州元脑智能科技有限公司王鹏飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利强化学习计算模拟方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120725093B 。
龙图腾网通过国家知识产权局官网在2025-11-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511233002.X,技术领域涉及:G06N3/092;该发明授权强化学习计算模拟方法、装置、电子设备及存储介质是由王鹏飞设计研发完成,并于2025-08-29向国家知识产权局提交的专利申请。
本强化学习计算模拟方法、装置、电子设备及存储介质在说明书摘要公布了:本发明公开了一种强化学习计算模拟方法、装置、电子设备及存储介质,涉及人工智能计算技术领域,包括将已确定的当前模型参数配置、当前硬件配置和当前工作负载输入至目标模拟系统得到多个并行分组组合,根据当前硬件配置确定目标模拟系统,基于预设的蒙特卡洛方法,从多个并行分组组合中确定有效并行分组组合,并输入至预设的神经网络模型的模拟器,通过模拟器根据有效并行分组组合进行延迟时间计算,且将最短延迟时间对应的组合作为目标并行分组组合,解决了模拟场景不匹配、精度不足、缺乏对异构集群有效支持的技术问题,通过高精度的性能建模和自动化探索,提供可靠的性能预测和最优并行策略建议,从而降低大规模GRPO训练的资源消耗。
本发明授权强化学习计算模拟方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种强化学习计算模拟方法,其特征在于,包括以下步骤: 确定当前模型参数配置、当前硬件配置和当前工作负载; 根据所述当前硬件配置确定目标模拟系统,并将所述当前模型参数配置、所述当前硬件配置和所述当前工作负载输入至所述目标模拟系统得到多个并行分组组合; 基于预设的蒙特卡洛方法,从所述多个并行分组组合中确定有效并行分组组合,将所述有效并行分组组合输入至预设的神经网络模型的模拟器,并通过所述模拟器根据所述有效并行分组组合进行延迟时间计算,且将最短延迟时间对应的组合作为目标并行分组组合; 其中,所述根据所述当前硬件配置确定目标模拟系统,包括:基于所述当前硬件配置,判断当前集群是否为同构集群;若所述当前集群为所述同构集群,则确定所述目标模拟系统为混合引擎模拟系统,否则,基于所述当前硬件配置,判断所述当前集群是否为异构集群;若所述当前集群为所述异构集群,则确定所述目标模拟系统为异步模拟系统。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215000 江苏省苏州市吴中经济开发区综保区经一路1号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励