Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种用在图形处理单元中的硬件资源调度方法和硬件调度器。用在图形处理单元中的硬件资源调度方法包括对于图形处理单元内部的任意一个硬件计算单元:从硬件计算单元获取指示硬件计算单元的任务或指令队列处于空闲状态还是已满状态的任务或指令队列...
  • 本发明公开了一种面向偶发性任务的海上移动边缘计算动态卸载方法,包括:获取任务的原始图像数据并进行预处理,得到任务数据;基于任务数据构建近海海事移动边缘计算的系统模型,包括计算模型、通信模型和任务队列模型;基于系统模型将最小化总阻塞成本的优化...
  • 本发明提供一种多任务多星遥测数据高效处理方法、系统和电子设备,涉及卫星地面遥测数据处理技术领域。包括:基于服务器集群中各计算节点的资源状态评估结果,将任务插件动态分配至最优计算节点;将任务注册信息上传至配置中心,并将信息中包含的遥测参数配置...
  • 本公开的实施例公开了基于虚拟集群的群体调度系统及装置。该系统的一具体实施方式包括:溯源同步模块:自动识别用户在虚拟集群中创建的负载对象,将负载对象对应的任务注解元数据同步至宿主集群中对应的执行单元,并在执行单元中写入与负载对象对应的地址注解...
  • 本申请提供一种GPU显存的智能分级与超额认购管理系统及方法,涉及GPU显存管理的技术领域,本申请包括:先建立包含第一性能区和第二性能区的分级存储体系;然后接收包含任务优先级和服务质量要求的显存分配请求,并监测数据访问模式和访问频率;再通过智...
  • 本公开涉及一种用于人工智能芯片集群的节点资源配置方法,包括对于任一节点:获取运行时遥测数据和运行时状态信息;基于运行时遥测数据和运行时状态信息,结合历史运行模型生成健康状态信息,包括:基于运行时遥测数据判断节点是否存在有效算力非正常下降,基...
  • 本公开关于一种性能监测驱动型异构计算任务硬件调度系统及方法,应用于支持硬件性能监测单元的指令集架构异构计算平台,性能监测接口模块获取到指令集架构异构计算平台中第一计算单元的第一性能指标数据及多个第二计算单元对应的第一性能指标数据和第二性能指...
  • 本发明公开了基于机器学习的显卡任务资源调度方法及系统,涉及机器学习与GPU调度技术领域,包括持续监测输入显卡的任务流,实时提取任务描述符并生成初始多维度任务画像,据此分配计算单元与显存资源。任务执行中,通过对比实际资源消耗轨迹与预期值生成资...
  • 本发明涉及高密度服务器能效优化技术领域,具体为基于资源调度的高密度服务器集群能效优化方法,包括:实时采集集群中各计算节点的多维度运行状态数据,并输入至预构建的负载特征分析模型,生成表征节点负载程度的节点负载特征值。根据节点负载特征值与集群能...
  • 本发明公开了一种Serverless向量数据库系统资源调度方法,包括采集Serverless向量数据库的负载特征并获取集群资源状态;基于负载特征和集群资源状态构建状态空间并进行归一化处理,通过DPPO算法的Actor‑Critic框架生成伸...
  • 本发明提供动态路由算法的多智能体最优分配方法,涉及人工智能技术领域,包括获取任务特征矩阵,构建多智能体能力矩阵,基于两者构建包含专长匹配度、成本及性能达标度的多目标优化函数,采用改进遗传算法求解获得最优分配方案;支持用户干预并自动校验更新;...
  • 面向分布式计算环境的时序感知学习自适应负载均衡方法,涉及分布式计算领域。解决了分布式计算环境中负载均衡方法多依赖静态规则或仅基于瞬时系统状态进行调度,难以充分利用负载变化时间相关性、对动态负载变化响应滞后、自适应能力不足的问题。所述方法包括...
  • 本公开的实施例提供了一种用于多智能体系统的方法、装置、设备和可读介质。该方法包括:响应于接收到指示针对目标任务的数据处理的请求,将请求发送至多个候选智能体;基于从多个候选智能体接收到的相应数据流中的标识信息,从多个候选智能体中确定至少一个目...
  • 本发明公开了一种大模型训练优化方法、装置、设备、介质及产品, 该方法包括:在针对目标模型分片的目标前向计算阶段,根据产生的激活值构建卸载任务并加入本地卸载任务队列;顺序执行卸载任务,将卸载激活值发送至主计算核的系统内存存储,并删除本地设备内...
  • 本发明提供了一种用于大语言模型推理的动态式KV‑Cache显存管理方法,基于最小粒度参数k,对KV‑Cache显存总池进行预划分,得到预划分后的多个最小粒度显存段;根据接收的大语言模型的当前批处理任务的序列长度,计算当前批处理任务适配的粒度...
  • 本发明涉及人工智能与算力调度技术领域,具体涉及一种基于人工智能大模型的算力调度优化系统,包括算力需求采集模块接收大模型计算量、时间窗口、节点适配类算力需求数据;算力调度预处理模块依据分析判定模块预设的负载阈值、分区数量等初始参数,处理采集到...
  • 本发明属于数据库管理技术技术领域,具体涉及一种数据库多级存储资源的动态调配方法及系统,包括以下步骤:S1:数据特征与存储状态采集,实时采集目标数据的多维特征参数与各存储层级的状态参数;S2:多维度数据价值评估,基于层次分析法构建数据价值评估...
  • 本发明提供了一种基于时间序列预测模型的指令集架构性能优化方法及装置,涉及人工智能技术领域,旨在解决现有数据存储系统由于未充分考虑目标应用特征导致内存分配效果不佳、以及无法自适应调整的技术问题。该方法包括:解析当前数据存储系统的指令流数据,得...
  • 本发明属于计算机技术领域,公开了一种虚拟化多用户系统的硬件资源分配方法及系统,该方法包括,在中间层驱动中,实时获取目标虚拟设备节点的运行时性能指标序列;将所述序列输入至预训练的扰动敏感度预测模型,输出该节点在未来预测时间窗口内发生性能扰动的...
  • 该发明针对金融交易流控现有技术缺陷,提出融合大语言模型时序推理能力的动态流控方案,适用于公积金管理、住房金融等需与第三方交互的高并发场景。方法通过六步实现:配置基于历史压力测试与运维经验的保守流控阈值;采集系统线上请求日志,提取多维度信息并...
技术分类