Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国石油大学(华东)王珣获国家专利权

中国石油大学(华东)王珣获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国石油大学(华东)申请的专利DeePMD-kit模型在神威超级计算机的运行方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119536816B

龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411593969.4,技术领域涉及:G06F9/38;该发明授权DeePMD-kit模型在神威超级计算机的运行方法是由王珣;宋弢;孟祥宇设计研发完成,并于2024-11-08向国家知识产权局提交的专利申请。

DeePMD-kit模型在神威超级计算机的运行方法在说明书摘要公布了:本发明涉及计算机技术领域,特别涉及DeePMD‑kit模型在神威超级计算机的运行方法,神威超级计算机的六个核心组CG分别负责MPI进程六个子区域的推理,每个核心组CG均包括MPE和64个CPE,MPE含有256位的SIMD单元;每个CPE含有512位的SIMD单元;每个CPE均含有本地数据存储器,每个本地数据存储器LDM均通过DMA策略和主存储实现连续数据传输;同一核心组CG中的CPE之间通过远程内存访问RMA实现数据传输;每个核心组CG的推理方法为:通过SACA加速耗时算子,MPE将耗时算子的计算密集部分分配给64个CPE;计算完成后,MPE同步64个CPE的计算结果,并将结果存储至主存储器中;SACA运行时SIMD并行:通过CPE发出512位向量化指令,通过上述技术方案,本发明具有使DeePMD‑kit模型可在神威计算机应用的优点。

本发明授权DeePMD-kit模型在神威超级计算机的运行方法在权利要求书中公布了:1.DeePMD-kit模型在神威超级计算机的运行方法,其特征在于,所述神威超级计算机的六个核心组CG分别负责MPI进程六个子区域的推理;所述神威超级计算机的编程接口为SACA; 每个所述核心组CG均包括与主存储器DDR相连的管理处理单元MPE和64个计算处理单元CPE,管理处理单元MPE含有256位的SIMD单元;每个计算处理单元CPE含有512位的SIMD单元;每个计算处理单元CPE均含有本地数据存储器LDM,每个本地数据存储器LDM均取消缓存配置,每个本地数据存储器LDM均通过DMA策略和主存储器DDR实现连续数据传输;同一核心组CG中的计算处理单元CPE之间通过远程内存访问RMA实现数据传输; 其中,每个核心组CG的推理方法为: 通过SACA加速DeePMD-kit模型算子中耗时算子,耗时算子包括Tabulate、TabulateGrad、ProdEnvMat、ProdForce、ProdVirial、Slice和Pad,管理处理单元MPE将耗时算子的计算密集部分根据原子ID分配给64个计算处理单元CPE,每个计算处理单元CPE分别计算对应划分的块; 计算处理单元CPE计算完成后,管理处理单元MPE执行athreadjoin指令同步64个计算处理单元CPE的计算结果,并将结果存储至主存储器DDR中; 在SACA运行时SIMD并行:通过计算处理单元CPE发出512位向量化指令提高DeePMD-kit模型算子中定制算子的并行效率,定制算子包括Tabulate、TabulateGrad、ProdEnvMat、ProdForce和ProdVirial。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国石油大学(华东),其通讯地址为:266400 山东省青岛市黄岛区长江西路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。