Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开一种云平台租户侧CPU算力资源隔离的方法, 涉及云计算技术领域;包括:步骤1:创建CPU算力资源隔离系统, 步骤2:通过CPU隔离配置模块定义计算节点CPU隔离相关参数并进行参数配置, 步骤3:通过操作系统CPU初始化模块配置目标...
  • 本申请提供一种推理实例管理方法及装置。所述方法应用于推理服务, 包括:在接收到来自推理引擎的第一报文时, 查询GPU资源池, 其中推理引擎用于监控推理实例的GPU资源使用情况, 第一报文为推理引擎监测到推理实例显存不足时发出的;若GPU资源...
  • 本发明涉及异构算力分配技术领域, 具体为一种基于大数据分析的异构算力动态分配方法, 包括以下步骤:分析数据任务来源、目标、类型及依赖, 归一化参数并提取特征, 识别关键任务, 结合算力资源队列与历史调度效率, 优化分配状态, 筛选运行正常的...
  • 本发明提供了一种基于主动获取机制的AIGC任务处理系统及方法, 用于解决AIGC任务处理过程中计算资源分配不均衡、系统扩展性受限等技术问题。该方法包括:在任务管理层维护任务队列用于存储待处理的AIGC任务;为每个任务分配唯一标识符并记录任务...
  • 本公开提供一种大模型内存的优化方法及装置、电子设备和存储介质, 该方法包括:响应于接收到的图结构的优化请求信息, 根据至少一个优化项确定目标图结构, 图结构用于表征模型的不同算子层之间中各个算子之间的连接关系, 从磁盘中加载目标图结构的权重...
  • 本申请公开一种负载迁移方法、装置和电子设备, 涉及集群资源管理与智能运维技术领域, 所公开的负载迁移方法包括:获得集群中各节点分别对应的历史时间序列数据, 节点对应的历史时间序列数据包括节点在历史时间序列的各时间点上分别对应的运行状态信息;...
  • 本申请公开了算力分配方法, 应用于第一服务端, 所述方法包括:基于负载均衡策略, 在多个服务端确定执行目标计算任务的第二服务端, 其中, 所述第一服务端和所述第二服务端相同或不同, 所述目标计算任务是从与所述服务端设置于同一数据共享网络中的...
  • 本发明涉及一种分布式系统数据管理方法和装置, 该方法包括实时扫描节点元数据并动态计算物理可用空间, 在执行存储操作前进行物理容量校验, 若空间不足则暂停操作并触发空间回收任务, 在数据迁移过程中响应数据块读取事件, 标记待清理状态, 并在目...
  • 本申请提出了一种基于动态权重与负载预测的自适应数据迁移负载均衡方法, 其中, 方法包括:接收数据迁移任务并进行任务拆分与打标签;根据权重系数与任务类型的映射规则计算当前负载;通过负载预测引擎模型预测数据迁移任务中的各性能指标变化趋势, 并根...
  • 本申请公开了一种处理方法及电子设备, 该方法包括:获得第一目标参数;第一目标参数至少表征处理器当前处于活跃状态的核心的数量;在配置文件中查找与第一目标参数匹配的目标功耗上限值;配置文件中包含配置项及设定功耗上限值的对应关系;配置项至少包括候...
  • 本公开提供了一种缓存管理方法、装置、电子设备、存储介质及程序产品, 涉及云计算技术领域。该方法包括:首先, 获取缓存池中至少两个缓存分区分别对应的冷启动比率实际值, 其中, 每个缓存分区用于存储其对应热点函数的函数实例, 冷启动比率实际值由...
  • 本发明提供了一种存储器的内存清空方法及系统, 涉及内存管理技术领域, 方法包括:获取内存中各个内存块的内存块地址;结合内存块地址, 基于Voronoi鞍点检测算法计算各个内存块的局部碎片密度;计算各个内存块的近邻内存块访问频率梯度以及与空闲...
  • 本发明涉及分布式计算和深度学习技术领域, 公开了一种基于深度学习的算力池智能整合与弹性调度方法, 包括:构建多层次图卷积网络对微服务间动态交互关系建模;基于算力状态指标和网络状态指标构建多维度评分模型;根据任务特性和资源状态动态调整微服务粒...
  • 本发明公开了基于机器学习的微服务架构智能负载均衡调度系统, 属于人工智能领域, 包括异常流量检测模块、异常故障模式识别模块、泛化增强型调度决策模块、自适应资源重分配模块、弹性控制模块、鲁棒性训练模块与系统联动协调模块。异常流量检测模块通过分...
  • 本发明涉及人工智能技术领域, 可应用于具身智能、金融科技及医疗健康等业务场景中, 公开了一种基于环境感知的任务处理方法、装置、设备及介质, 包括:获取环境数据并生成动态环境模型;接收任务指令并解析, 生成初始任务目标;结合动态环境模型, 将...
  • 本发明涉及数据处理技术领域, 尤其涉及一种基于AI大模型的算力资源优化方法, 包括步骤S1, 对实时算力状态数据和工作状态数据进行获取;步骤S2, 对算力告警信息进行推送并进行占比调整;步骤S3, 对算力资源优化决策进行决策调整并对决策调整...
  • 本发明涉及电数字数据处理技术领域, 尤其涉及一种AI大模型调用负载均衡方法、装置、设备及介质。方法包括:确定各个备选AI大模型的擅长领域标签, 筛选出与擅长领域标签匹配的预设问题领域类别;当检测到待处理问题请求集合时, 通过问题请求分类模型...
  • 本发明涉及电数字数据处理技术领域, 尤其涉及一种AI大模型调用负载均衡方法、装置、设备及介质。方法包括:获取各个模型供应商提供的AI大模型的模型应用信息;根据关键负载均衡参数和可选负载均衡模式, 确定当前负载均衡模式;可选负载均衡模式包括:...
  • 本发明属于计算机存储相关技术领域, 其公开了一种基于区域感知公平性的I/O流请求处理方法及处理系统, 包括如下写请求处理:将激进I/O流的写请求以及非激进I/O流中不满足顺序写约束的写请求均存入写请求访问目标区域所对应的节流层存储链表中;识...
  • 本发明公开了一种空天地一体化多智能体协同大模型在线训练方法及系统。本发明基于多节点资源异构性动态生成分布式混合精度量化配置表, 为不同节点分配适宜的参数精度;采用跨节点梯度残差分发与局部补偿策略, 在节点间仅传输压缩后的梯度残差并本地累积误...
技术分类