Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于动态适配器的大语言模型增强方法及系统, 首先, 对预训练的大语言模型的主干网络进行扩展, 增加多个专家适配器, 并在其中插入门控网络。然后, 根据输入的令牌, 利用门控网络动态地路由选择并激活特定的专家适配器。接着, 采用...
  • 一种任务处理方法, 应用于人工智能(artificial intelligence, AI)领域。在该任务处理方法中, 通过在提示词之前基于任务类型来添加相应的词元, 且所添加的词元能够转换为相应的向量, 能够实现在任务输入的基础上添加与任...
  • 一种任务处理方法, 应用于减少模型处理任务时的计算开销。在该任务处理方法中, 将模型处理文本时所提取得到的序列特征预先缓存起来, 并在获取到的任务所对应的一部分文本是已经缓存有序列特征的文本时, 则从缓存数据中获取这部分文本所对应的序列特征...
  • 一种用于生成机器人运动程序的数据集以训练路径生成神经网络的方法。大型语言模型用于配置任务环境并生成创建机器人模拟的代码。大型语言模型使用机器人任务库和资产几何数据库作为输入。基于任务和资产输入以及任务指令, 大型语言模型将任务分解为多个步,...
  • 本发明涉及大模型算法技术领域, 尤其涉及一种基于知识蒸馏的领域大模型轻量化自适应方法及系统, 该方法获取知识蒸馏参数与学生模型性能参数, 建立两者非线性映射关系;基于映射关系优化求解最佳参数组合, 生成目标知识蒸馏参数;将目标参数下发至训练...
  • 本申请提供了一种应用于人工智能领域的人工智能模型参数优化方法以及相关装置, 应用于人工智能模型训练系统, 人工智能模型训练系统包括多个计算单元, 多个计算单元用于训练神经网络模型, 每个计算单元用于对神经网络模型的至少一层网络层进行训练。该...
  • 本公开实施例涉及基于一维卷积的神经网络处理。为了改进卷积神经网络(N)的效率和处理速度, 在神经网络(N)的第一层(K1)中执行第一一维卷积, 从而将第一一维滤波器核(K11)与从数据立方体(B)中提取的第一一维数据向量(D1)进行卷积, ...
  • 本公开提供了一种模型架构生成方法及装置、电子设备、存储介质, 该方法包括:根据待处理任务的任务类型和模型限制条件, 从目标搜索空间中确定出针对待处理任务的第一处理模型的模型架构信息;根据第一处理模型的模型架构信息及模型评分, 通过网络分析模...
  • 本发明提供一种结合PTQ和QAT的AISP_2D模型量化方法, 所述方法包括:S1, PTQ量化模型, 优化模型量化超参得到model_ptq;S2, 判断model_ptq量化损失, 看损失是否在接受范围?如果在, 则结束;如果不在, 则...
  • 本发明公开了一种基于混沌粒子群优化神经网络的RH蒸汽消耗量预测方法及装置, 涉及工业数据分析与预测技术领域。该方法包括将当前时段影响RH蒸汽消耗量的特征变量输入至训练好的RH蒸汽消耗量预测模型, 输出未来时段的RH蒸汽消耗量, 所述RH蒸汽...
  • 一种物理储层元件包括第一输入端子、第二输入端子、第一采样和保持电路、第一输出端子和第一非线性电路。第一输入端子被配置为能够连接到将输入信号传输到物理储层的输入源。第二输入端子被配置为能够连接到一个或多个其他物理储层元件。第一非线性电路被设置...
  • 本申请公开了使用灵活浮点张量的人工神经网络训练。因此, 本公开涉及用于使用张量来训练神经网络的系统和方法, 所述张量包括多个FP16值和定义由所述张量中所包括的所述FP16值中的一些或全部共享的指数的多个位。所述FP16值可以包括IEEE ...
  • 本发明公开了一种基于浮栅结构的移位累加半导体器件及其使用方法, 属于半导体技术领域。该移位累加半导体器件通过不断向器件的输入端口传输待计算电压, 可将依次传入的电压信息逐个累加或以二进制关系移位并累加计算, 可减小神经网络加速硬件系统中的成...
  • 本发明公开一种基于低秩适配的预训练大模型微调效率优化方法, 由于现阶段的基于Transformer的大规模预训练模型的计算成本非常高昂, 这些预训练模型的训练算力要求高, 即便现在有如Adapter、LoRA、Prompt‑Tuning等方...
  • 本发明是一种参数化系统的参数训练方法。参数化系统广泛存在于工程应用中, 包括人工神经网络和数字滤波器等。本发明可以根据训练数据开展参数化系统的参数训练, 最终实现系统设计。主要内容包括系统矩阵化描述、训练数据矩阵扩展处理、系统特征矩阵处理和...
  • 本公开提供了物理信息求解器的训练方法、装置、设备以及存储介质, 涉及人工智能技术领域, 尤其涉及神经网络、机器学习等技术领域。具体实现方案为:通过物理信息求解器的物理残差自适应模块基于第一数据进行自适应跳跃处理, 得到第二数据;基于所述第二...
  • 本申请实施例提供一种三维模型建模序列生成网络的训练方法、装置及电子设备。该方法包括:获取样本图像和第一模型, 样本图像中包括图形对象, 第一模型是对图形对象进行三维建模得到的模型;对第一模型进行分解处理, 得到第一模型对应的建模序列, 建模...
  • 本申请实施例提供一种模型训练优化方法及装置, 该方法包括:主AI服务器获取包括N个网络层的神经网络模型、包括M个训练数据的训练集、R个训练设备以及批次数量S;根据R个训练设备对N个网络层进行划分获得P1种第一划分方式, 根据S个批次对M个训...
  • 本发明提出一种基于梯度范数感知最小化的目标检测加固优化方法及装置, 属于无人驾驶和机器学习领域。其中, 所述方法包括:获取待训练的无人驾驶目标检测模型及其训练集;在对模型进行每轮训练时, 按照预设的批次大小从训练集中分批采集训练样本组成迭代...
  • 本发明属于人工智能技术领域, 公开了一种用于提升大语言模型数学能力的强化学习方法及相关装置;其中, 所述强化学习方法包括:获取待增强大语言模型以及强化学习数据集;采用强化学习对待增强大语言模型进行微调训练, 且在微调训练同时应用蒙特卡罗估计...
技术分类