Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供一种民航行业级数据服务平台的任务调度方法、装置、设备及介质,涉及任务调度技术领域,该方法包括:确定待调度的任务集合中每个任务的任务类型;若确定任一个计算密集型分析任务的资源需求超过预设资源阈值且该计算密集型分析任务是可分解的,则将...
  • 本发明涉及计算机技术领域,尤其涉及一种任务队列调度方法、装置、电子设备和介质,方法包括获取第一进程中每一缓冲区在当前预设周期对应的缓冲队列实际吞吐率和缓冲队列预测吞吐率;将当前预设周期对应的缓冲队列预测吞吐率小于预设的吞吐率阈值的缓冲区确定...
  • 本申请公开了一种数据传输方法和装置、存储介质及电子设备,涉及计算技术领域,包括:第一实例接收第二实例发送的第一传输指示信息;在所述第一传输指示信息指示所述第二实例处于目标实例状态的情况下,向所述第二实例发送第二键值缓存子集,从而根据第二实例...
  • 本发明公开了一种大数据处理平台下的任务调度方法。该方法包括:资源管理器根据节点管理器上报的节点可用资源和节点的能耗比更新节点状态;调度管理器根据节点状态执行二级筛选,并按照初级筛选节点的综合能耗比降序加入并更新节点队列;当任务请求分配容器时...
  • 本发明涉及测绘数据处理技术领域,公开了一种基于云计算的测绘数据处理方法,所述方法包括:获取地形高程、地形坡度和环境参数,基于所述数据进行多源融合与特征提取,得到初步特征集,对初步特征集执行动态纠正与完整性校验,生成校正特征集;通过残差分析得...
  • 本申请涉及数据存储技术领域,特别是涉及一种基于GPU扩展的大模型权重数据存储系统,系统包括:主显存、扩展显存、数据库、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:将可存储的多个解码器权重数据由扩展显存加载至主...
  • 本申请涉及数据存储技术领域,特别是涉及一种基于GPU扩展的大模型中间数据存储系统,所述系统包括:主GPU芯片、扩展显存、数据库、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:在大模型执行推理任务时,先将目标用户...
  • 本申请涉及数据存储技术领域,特别是涉及一种基于用户交互检测的GPU扩展存储系统,系统包括:主GPU芯片、扩展显存、数据库、处理器和存储有计算机程序的存储器,在大模型执行推理任务时,在计算得到目标用户的KV缓存数据之后,即对目标用户进行交互检...
  • 本申请涉及数据存储技术领域,特别是涉及一种支持多用户的GPU扩展存储系统,系统包括:主GPU芯片、扩展显存、数据库、处理器和存储有计算机程序的存储器,在大模型执行推理任务时,先将目标用户对应的KV缓存数据存储于性能较高的主显存中,以保证应用...
  • 本公开涉及用于选择处理器频率的技术。用于选择处理单元频率的装置、系统和技术。在至少一个实施例中,至少部分地基于动态测量的一个或更多个集成电路的最大吞吐量,动态调整一个或更多个集成电路的工作频率。
  • 本申请提出一种线程绑定方法、装置、NUMA架构系统及产品,该方法包括:获取NUMA架构系统的配置信息,以及获取应用程序的线程特征信息,所述线程特征信息包括线程数量、线程之间的数据依赖关系和线程的内存访问模式中的至少一项;根据所述应用程序的线...
  • 本申请涉及一种汽车零部件检测方法和系统。所述汽车零部件检测方法包括:响应于用户的检测请求,获取与所述检测请求对应的检测资源;所述检测资源包括预设目标信息和检测工具;基于所述检测工具通过预设通讯线路对待测样品进行检测,得到检测输出信息;将所述...
  • 本申请公开了基于大语言模型的请求处理方法、装置、设备以及计算机存储介质。所述请求处理方法包括:基于用户端的请求的文本长度和大语言模型的参数量计算请求负载;判断请求负载是否大于或等于预设阈值;若请求负载大于或等于预设阈值,则分发至第一服务器处...
  • 本发明提供一种数据分片的资源分配与管理系统,包括多个工作节点,其中每个工作节点承载分片实际处理逻辑,并通过心跳租约向分片管理器周期性上报状态信息;分片管理器,用于基于每个工作节点的心跳状态动态检测节点故障、扩容或缩容事件;在节点状态发生变化...
  • 本发明实施例公开了一种强化学习驱动的芯粒资源优化配置方法、系统及介质,方法包括:构建包含芯粒类型的芯粒库,芯粒类型包括滤波器、低噪声放大器、混频器和可变增益放大器芯粒,每个芯粒通过多维参数矩阵描述本征特征参数;根据目标任务的性能需求确定评估...
  • 本公开提供了一种混合专家系统中的专家部署方法、装置、设备及存储介质,涉及人工智能、算力和大模型等技术领域。具体实现方案为:确定专家部署过程中所需的物理专家的第一数量;物理专家的第一数量等于混合专家系统中逻辑专家的数量与部署中逻辑专家冗余的冗...
  • 本公开提供了一种中央处理器核资源的分配方法、装置、设备及存储介质,涉及业务部署、资源管理、资源分配、算力和大模型等技术领域。具体实现方案为:确定当前业务的容器需要隔离的中央处理器核资源的目标数量;基于所述目标数量,确定需要隔离的中央处理器核...
  • 本发明提供了一种软件定义的试验资源容器化亲和性调度部署方法,该方法主要包括三方面内容:试验资源亲和性部署策略生成、试验资源镜像封装、多用户试验资源并行容器部署。本发明首次提出的一种软件定义的试验资源容器化亲和性调度部署技术。其优势体现在:一...
  • 本发明公开了一种基于GQA特征优化的大语言模型推理加速方法,所述方法包括:步骤一、确定查询张量Q的切分粒度,将所述查询张量Q切分为一个或多个子任务;步骤二、自适应确定键张量K和值张量V的切分数量;步骤三、计算查询张量Q,计算完成后将键张量K...
  • 本申请实施例提供一种AIGC资源分配方法、装置、系统及存储介质。方法包括:获取在当前周期内提交的多个新任务;将多个新任务输出至轻量级大模型,以通过轻量级大模型确定每个新任务所需的资源消耗;将多个新任务和历史积压任务添加至当前周期的待执行任务...
技术分类