Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供了一种用于大语言模型推理的动态式KV‑Cache显存管理方法,基于最小粒度参数k,对KV‑Cache显存总池进行预划分,得到预划分后的多个最小粒度显存段;根据接收的大语言模型的当前批处理任务的序列长度,计算当前批处理任务适配的粒度...
  • 本发明公开了一种大模型训练优化方法、装置、设备、介质及产品, 该方法包括:在针对目标模型分片的目标前向计算阶段,根据产生的激活值构建卸载任务并加入本地卸载任务队列;顺序执行卸载任务,将卸载激活值发送至主计算核的系统内存存储,并删除本地设备内...
  • 本公开的实施例提供了一种用于多智能体系统的方法、装置、设备和可读介质。该方法包括:响应于接收到指示针对目标任务的数据处理的请求,将请求发送至多个候选智能体;基于从多个候选智能体接收到的相应数据流中的标识信息,从多个候选智能体中确定至少一个目...
  • 面向分布式计算环境的时序感知学习自适应负载均衡方法,涉及分布式计算领域。解决了分布式计算环境中负载均衡方法多依赖静态规则或仅基于瞬时系统状态进行调度,难以充分利用负载变化时间相关性、对动态负载变化响应滞后、自适应能力不足的问题。所述方法包括...
  • 本发明提供动态路由算法的多智能体最优分配方法,涉及人工智能技术领域,包括获取任务特征矩阵,构建多智能体能力矩阵,基于两者构建包含专长匹配度、成本及性能达标度的多目标优化函数,采用改进遗传算法求解获得最优分配方案;支持用户干预并自动校验更新;...
  • 本发明公开了一种Serverless向量数据库系统资源调度方法,包括采集Serverless向量数据库的负载特征并获取集群资源状态;基于负载特征和集群资源状态构建状态空间并进行归一化处理,通过DPPO算法的Actor‑Critic框架生成伸...
  • 本发明涉及高密度服务器能效优化技术领域,具体为基于资源调度的高密度服务器集群能效优化方法,包括:实时采集集群中各计算节点的多维度运行状态数据,并输入至预构建的负载特征分析模型,生成表征节点负载程度的节点负载特征值。根据节点负载特征值与集群能...
  • 本发明公开了基于机器学习的显卡任务资源调度方法及系统,涉及机器学习与GPU调度技术领域,包括持续监测输入显卡的任务流,实时提取任务描述符并生成初始多维度任务画像,据此分配计算单元与显存资源。任务执行中,通过对比实际资源消耗轨迹与预期值生成资...
  • 本公开关于一种性能监测驱动型异构计算任务硬件调度系统及方法,应用于支持硬件性能监测单元的指令集架构异构计算平台,性能监测接口模块获取到指令集架构异构计算平台中第一计算单元的第一性能指标数据及多个第二计算单元对应的第一性能指标数据和第二性能指...
  • 本公开涉及一种用于人工智能芯片集群的节点资源配置方法,包括对于任一节点:获取运行时遥测数据和运行时状态信息;基于运行时遥测数据和运行时状态信息,结合历史运行模型生成健康状态信息,包括:基于运行时遥测数据判断节点是否存在有效算力非正常下降,基...
  • 本申请提供一种GPU显存的智能分级与超额认购管理系统及方法,涉及GPU显存管理的技术领域,本申请包括:先建立包含第一性能区和第二性能区的分级存储体系;然后接收包含任务优先级和服务质量要求的显存分配请求,并监测数据访问模式和访问频率;再通过智...
  • 本公开的实施例公开了基于虚拟集群的群体调度系统及装置。该系统的一具体实施方式包括:溯源同步模块:自动识别用户在虚拟集群中创建的负载对象,将负载对象对应的任务注解元数据同步至宿主集群中对应的执行单元,并在执行单元中写入与负载对象对应的地址注解...
  • 本发明提供一种多任务多星遥测数据高效处理方法、系统和电子设备,涉及卫星地面遥测数据处理技术领域。包括:基于服务器集群中各计算节点的资源状态评估结果,将任务插件动态分配至最优计算节点;将任务注册信息上传至配置中心,并将信息中包含的遥测参数配置...
  • 本发明公开了一种面向偶发性任务的海上移动边缘计算动态卸载方法,包括:获取任务的原始图像数据并进行预处理,得到任务数据;基于任务数据构建近海海事移动边缘计算的系统模型,包括计算模型、通信模型和任务队列模型;基于系统模型将最小化总阻塞成本的优化...
  • 本公开提供了一种用在图形处理单元中的硬件资源调度方法和硬件调度器。用在图形处理单元中的硬件资源调度方法包括对于图形处理单元内部的任意一个硬件计算单元:从硬件计算单元获取指示硬件计算单元的任务或指令队列处于空闲状态还是已满状态的任务或指令队列...
  • 本发明公开了一种端侧大模型的指令集动态配置方法及系统,涉及指令集配置技术领域,该方法包括:当检测到用户启动端侧大模型或触发大模型人机交互时,采集生成标准化输入特征向量;将标准化输入特征向量输入预训练的任务预测模型,输出预测任务、预测启动时间...
  • 本申请实施例提供了一种分布式锁的任务互斥控制方法、装置、电子设备及介质。方法包括:确定分布式锁集合;其中,分布式锁集合包括:基于Redis的第一分布式锁和基于数据库的第二分布式锁;获取待加锁的目标任务;通过第一分布式锁对目标任务执行互斥加锁...
  • 本发明公开了一种多场景下操作任务点击行为的防重触发方法,所述防重触发方法包括:采用Redis分布式加锁;记录数据库任务表过程;解锁任务过程;清理任务过程。利用Redis分布式锁+任务记录表给出一套完整的多方案整合的通用方案。
  • 本申请实施例提供了一种通信方法、装置、系统及可读存储介质。该方法包括:第一智能体获得键值对,该键值对包括关键字和关键字对应的值,该值用于对关键字解释;该第一智能体向第二智能体发送键值对或键值对的信息。本申请的方案能够统一不同智能体对同一词汇...
  • 本发明提供了一种多级优先级消息处理方法、系统、设备及介质,属于分布式消息中间件技术领域。方法包括:通过配置文件定义消息优先级参数,通过解析配置文件生成优先级配置数据;基于优先级配置数据,初始化消息生产者和消费者实例,建立配置数据与处理实例的...
技术分类