Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种数据处理方法、装置、电子设备及存储介质,属于计算机技术领域。在该方法包括:获取大语言模型的推理请求集,推理请求集包括多个推理请求分别对应的词元序列;对推理请求集中的多个词元序列分别进行分块,得到推理请求集对应的多个序列块组,...
  • 本公开提供了一种模型训练方法、数据处理方法、装置、电子设备和存储介质,涉及人工智能和大数据技术领域。具体实现方案为:处理器根据待训练模型的多个模型层中各个模型层的采样概率从多个模型层中确定目标模型层,采样概率用于控制多个模型层中参与参数扰动...
  • 本发明公开了一种基于MoE的水文机理模型参数优化方法,首先在数据预处理阶段,对流域历史数据进行场次划分与标准化,提取各场次的关键水文特征;在参数分析阶段,采用全局敏感性分析方法对水文机理模型参数进行分层,形成高、中、低敏感参数集;在混合专家...
  • 本发明涉及深度学习模型训练技术领域,公开了一种用于CNN‑Transformer混合架构识别模型的分布式训练方法,获取Transformer块组件和卷积块组件的参数数据量和张量形状特征,根据参数数据量和张量形状特征,计算得到Transfor...
  • 本公开提供了一种基于时间阈值稀疏化的联邦学习方法,属于数据处理技术领域,具体包括:初始化全局模型参数;每个客户端在每轮中计算完整本地梯度并发送至参数服务器,参数服务器利用FedAvg算法进行梯度聚合并更新全局模型,对全局梯度进行幂律分布拟合...
  • 本发明属于机器学习训练技术领域,具体为一种使用异构GPU和动态实例训练大模型的系统和方法。本发明系统包括消耗估算模块、自动并行模块、异构训练模块、动态监控模块;系统支持感知异构GPU的计算能力,支持使用动态实例,自动生成并行策略并根据GPU...
  • 本申请提供了一种模型训练方法及装置。该方法包括:第一节点从第二节点接收第二模型块输出的第一数据集;第一节点针对第一数据集,执行第一模型块的训练任务中的第一任务;第一节点从第二节点接收第二模型块输出的第二数据集;在第一节点针对第一数据集,完成...
  • 本申请提供了一种模型训练方法及装置。该方法包括:将目标模型的训练集划分为多个训练子集;其中,多个训练子集和多个节点一一对应;将多个训练子集中的每个训练子集发送至训练子集对应的节点,使得训练子集对应的节点针对训练子集,执行目标模型的计算,以得...
  • 本申请提供了一种模型训练方法及装置。该方法包括:将目标模型的训练集划分为多个训练子集;其中,多个训练子集和多个节点一一对应;将多个训练子集中的每个训练子集发送至训练子集对应的节点,使得训练子集对应的节点针对训练子集,执行目标模型的计算,以得...
  • 本公开涉及一种基于渐进专家混合网络的自动驾驶进化方法及系统,可解决现有专家混合网络难以随新驾驶工况扩展进化、存在灾难性遗忘和知识迁移不足的问题。该方法周期性对专家混合网络进行训练:对新驾驶工况,在已有专家网络基础上增加新专家形成新专家网络,...
  • 本发明涉及海洋遥感技术领域,具体为物理信息耦合网络模型及海洋大气多参数协同反演方法,旨在解决现有技术中频谱信息利用不足、建模参数耦合效果差及多任务失衡问题。具体包括以下步骤:通过融合实测数据与ERA5再分析数据构建数据集;基于辐射传输模型定...
  • 本发明公开了一种基于审计法规知识图谱的审计风险智能管控大模型优化方法及系统,首先采用网络爬虫方式收集不同问题领域审计法规和行业政策的非结构化文档并作为初始语料,再对初始语料进行文本清洗并按照一条一款粒度对每条法规进行切片处理并结构化存储;本...
  • 本申请涉及一种人工智能模型训练方法、装置、计算机设备、介质和产品。方法包括:获取导航任务;在按照难易程度依序执行导航任务中的子导航任务过程中,获取处于执行过程中的子导航任务的驾驶状态信息,通过人工智能模型依据驾驶状态信息确定驾驶动作指令,执...
  • 本发明公开了一种基于轨道动作预判的强化学习卫星追逃方法及系统,该方法构建SAC策略网络,设计合适的loss函数进行反向传播,训练出模型的初始策略;在SAC算法中引入了好奇心机制,使用全连接网络预测结果与实际的误差作为奖励信号,鼓励智能体对动...
  • 本发明涉公开了一种小语言模型的训推解耦与异步重叠的强化学习方法及其系统,其特点是采用训推解耦与迭代内异步调度方法,在不改变原有GRPO算法语义与收敛性质,实现推理与训练的并行执行,所述训推解耦通过在不同的GPU资源组上部署推理Worker与...
  • 本发明提供一种奖励工具的构建方法及装置、存储介质及电子设备,属于人工智能领域,该方法包括:在目标模型接收到查询信息时,基于查询信息确定任务类型;判断是否已存在与任务类型相匹配的奖励工具;若不存在,则基于任务类型和奖励评估策略,生成多个奖励方...
  • 本发明公开了一种基于不确定性量化与诚实性奖励的金融数据的大语言模型训练方法及系统,该方法包括获取金融领域的自然语言问题文本,对该文本进行预处理;将预处理后的自然语言问题文本输入到待训练的大语言模型中,得到综合不确定性分数;基于综合不确定性分...
  • 本公开提供一种模型训练、任务处理方法、装置、产品、设备及介质。所述方法包括:基于每个任务在当前轮次的采样分布,控制待训练模型进行任务采样,以得到采样数据;根据采样数据确定每个任务的执行指标,并根据执行指标确定每个任务在下一轮次的采样分布,执...
  • 本发明提供一种奖励模型、策略模型训练方法、装置、电子设备及存储介质,属于人工智能技术领域,包括:获取偏好数据对,包括针对同一提示词生成的优选响应和非优选响应,优选响应和非优选响应均由多个文本单元序列构成;将每个文本单元序列输入至待训练奖励模...
  • 本发明公开了一种基于混合世界模型的多任务深度强化学习系统。系统包括:多任务环境模型、智能体策略以及混合世界模型;其中,混合世界模型的架构通过混合多个专家Transformer,并串联共享Transformer设计而成,各专家Transfor...
技术分类