阿里云飞天(杭州)云计算技术有限公司尤金鑫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里云飞天(杭州)云计算技术有限公司申请的专利GPU算力调度方法、装置、设备、存储介质及程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120104346B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510571609.2,技术领域涉及:G06F9/50;该发明授权GPU算力调度方法、装置、设备、存储介质及程序产品是由尤金鑫;郭清设计研发完成,并于2025-05-06向国家知识产权局提交的专利申请。
本GPU算力调度方法、装置、设备、存储介质及程序产品在说明书摘要公布了:本申请实施例提供一种GPU算力调度方法、装置、设备、存储介质及程序产品,应用于计算机技术领域。该方法包括:获取目标主机内各个GPU分区的拓扑信息,并根据拓扑信息确定GPU分区的性能基线数据;根据目标虚拟机的需求数据以及各个GPU分区的性能基线数据,确定目标虚拟机对应的第一目标GPU分区,使得目标虚拟机基于第一目标GPU分区进行任务处理;在目标主机内各个GPU分区对应的资源碎片化信息满足预设条件的情况下,根据处于运行状态的目标虚拟机的需求数据以及各个GPU分区的性能基线数据,确定目标虚拟机对应的第二目标GPU分区,使得目标虚拟机基于所述第二目标GPU分区进行任务处理。这样能够确保GPU的卡间通信效率,能够提高任务处理效率和任务处理性能。
本发明授权GPU算力调度方法、装置、设备、存储介质及程序产品在权利要求书中公布了:1.一种GPU算力调度方法,其特征在于,包括: 获取目标主机内各个GPU分区的拓扑信息,并根据所述拓扑信息确定所述GPU分区的性能基线数据;所述性能基线数据用于表征所述GPU分区的通信性能以及离散程度;所述性能基线数据包括通信因子以及离散因子; 根据目标虚拟机的需求数据以及各个GPU分区的性能基线数据,确定所述目标虚拟机对应的第一目标GPU分区,使得所述目标虚拟机基于所述第一目标GPU分区进行任务处理; 获取各个GPU分区对应的实时离散因子,并根据所述实时离散因子计算所述GPU分区对应的全局离散因子;在所述全局离散因子大于预设离散阈值的情况下,确定所述目标主机内各个GPU分区对应的资源碎片化信息满足预设条件;所述实时离散因子为预设周期内各个GPU分区对应的离散因子;所述实时离散因子为各个GPU分区实时的离散因子;所述全局离散因子为各个GPU分区对应的平均实时离散因子;或者, 获取所述目标虚拟机的任务性能数据;所述任务性能数据包括实际GPU利用率、实际通信带宽以及任务实际迭代速度其中至少一种;在所述任务性能数据小于预设性能阈值的情况下,确定所述目标主机内各个GPU分区对应的资源碎片化信息满足预设条件; 在所述目标主机内各个GPU分区对应的资源碎片化信息满足预设条件的情况下,根据处于运行状态的目标虚拟机的需求数据以及各个GPU分区的性能基线数据,确定所述目标虚拟机对应的第二目标GPU分区,使得所述目标虚拟机基于所述第二目标GPU分区进行任务处理; 所述根据所述拓扑信息确定所述GPU分区的性能基线数据,包括: 针对每个GPU分区,根据所述拓扑信息确定所述GPU分区的拓扑结构以及互联方式,并根据所述拓扑结构以及所述互联方式确定所述GPU分区的通信因子; 根据所述拓扑信息确定所述GPU分区中每个GPU的物理位置编码,并根据所述物理位置编码,计算所述GPU分区对应的物理分布数据,并将所述物理分布数据作为所述GPU分区的离散因子;所述物理分布数据指所述GPU分区内各个GPU卡对应的物理分布离散化程度数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里云飞天(杭州)云计算技术有限公司,其通讯地址为:311199 浙江省杭州市临平区星桥街道星桥北路173号2幢121室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。