Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及计算机技术领域,提供了一种模型压缩方法、装置和系统,方法包括根据量化操作参数对人工智能模型进行量化操作,以对人工智能模型的模型参数的格式进行转换;以及,还根据人工智能模型的量化后模型参数生成稀疏化操作参数,根据稀疏化操作参数对人工...
  • 本发明公开了一种基于量子计算的大模型量化方法,包括:获取语言模型中各个网络层的异常值数据;量化获取的异常值数据对量化操作的敏感程度作为精度评估因子;基于精度评估因子和基础模型参数以及量化问题进行哈密尔顿建模获得目标哈密顿量,并转化为QUBO...
  • 本发明提供了一种基于格拉姆矩阵正交性的卷积神经网络剪枝方法和装置,涉及卷积神经网络剪枝的技术领域,该方法包括:将特征图训练样本输入当前卷积神经网络得到输出特征;针对各卷积层,确定通道维度的参数格拉姆矩阵(元素表征通道卷积核相关性),计算其对...
  • 本发明公开了一种基于虚拟对抗的多模态大模型安全指令微调方法及系统,属于大模型领域。本发明对多模态大模型进行两阶段微调:第一阶段通过基于梯度的虚拟对抗扰动技术,对大语言模型及跨模态连接层进行安全对齐,确保模型输出内容无害,并提升对后续有毒数据...
  • 本申请提供了一种模型训练方法、装置、电子设备、存储介质及计算机程序产品,涉及技术领域为:人工智能技术领域,方法包括:第一计算单元和第二计算单元针对第一数据产生第一中间数据的第一数值交互确定第二中间数据的第一数值;第二计算单元与第一计算单元交...
  • 本申请公开了一种神经网络模型的训练方法、装置、电子设备及存储介质。通过初始化比例参数,在每个周期迭代训练前,获取待训练神经网络模型的中间层中可训练参数的梯度范数,并根据预设更新策略对比例参数进行更新,以利用梯度范数和更新后的比例参数从中间层...
  • 本发明公开了一种基于混合世界模型的多任务深度强化学习系统。系统包括:多任务环境模型、智能体策略以及混合世界模型;其中,混合世界模型的架构通过混合多个专家Transformer,并串联共享Transformer设计而成,各专家Transfor...
  • 本发明提供一种奖励模型、策略模型训练方法、装置、电子设备及存储介质,属于人工智能技术领域,包括:获取偏好数据对,包括针对同一提示词生成的优选响应和非优选响应,优选响应和非优选响应均由多个文本单元序列构成;将每个文本单元序列输入至待训练奖励模...
  • 本公开提供一种模型训练、任务处理方法、装置、产品、设备及介质。所述方法包括:基于每个任务在当前轮次的采样分布,控制待训练模型进行任务采样,以得到采样数据;根据采样数据确定每个任务的执行指标,并根据执行指标确定每个任务在下一轮次的采样分布,执...
  • 本发明公开了一种基于不确定性量化与诚实性奖励的金融数据的大语言模型训练方法及系统,该方法包括获取金融领域的自然语言问题文本,对该文本进行预处理;将预处理后的自然语言问题文本输入到待训练的大语言模型中,得到综合不确定性分数;基于综合不确定性分...
  • 本发明提供一种奖励工具的构建方法及装置、存储介质及电子设备,属于人工智能领域,该方法包括:在目标模型接收到查询信息时,基于查询信息确定任务类型;判断是否已存在与任务类型相匹配的奖励工具;若不存在,则基于任务类型和奖励评估策略,生成多个奖励方...
  • 本发明涉公开了一种小语言模型的训推解耦与异步重叠的强化学习方法及其系统,其特点是采用训推解耦与迭代内异步调度方法,在不改变原有GRPO算法语义与收敛性质,实现推理与训练的并行执行,所述训推解耦通过在不同的GPU资源组上部署推理Worker与...
  • 本发明公开了一种基于轨道动作预判的强化学习卫星追逃方法及系统,该方法构建SAC策略网络,设计合适的loss函数进行反向传播,训练出模型的初始策略;在SAC算法中引入了好奇心机制,使用全连接网络预测结果与实际的误差作为奖励信号,鼓励智能体对动...
  • 本申请涉及一种人工智能模型训练方法、装置、计算机设备、介质和产品。方法包括:获取导航任务;在按照难易程度依序执行导航任务中的子导航任务过程中,获取处于执行过程中的子导航任务的驾驶状态信息,通过人工智能模型依据驾驶状态信息确定驾驶动作指令,执...
  • 本发明公开了一种基于审计法规知识图谱的审计风险智能管控大模型优化方法及系统,首先采用网络爬虫方式收集不同问题领域审计法规和行业政策的非结构化文档并作为初始语料,再对初始语料进行文本清洗并按照一条一款粒度对每条法规进行切片处理并结构化存储;本...
  • 本发明涉及海洋遥感技术领域,具体为物理信息耦合网络模型及海洋大气多参数协同反演方法,旨在解决现有技术中频谱信息利用不足、建模参数耦合效果差及多任务失衡问题。具体包括以下步骤:通过融合实测数据与ERA5再分析数据构建数据集;基于辐射传输模型定...
  • 本公开涉及一种基于渐进专家混合网络的自动驾驶进化方法及系统,可解决现有专家混合网络难以随新驾驶工况扩展进化、存在灾难性遗忘和知识迁移不足的问题。该方法周期性对专家混合网络进行训练:对新驾驶工况,在已有专家网络基础上增加新专家形成新专家网络,...
  • 本申请提供了一种模型训练方法及装置。该方法包括:将目标模型的训练集划分为多个训练子集;其中,多个训练子集和多个节点一一对应;将多个训练子集中的每个训练子集发送至训练子集对应的节点,使得训练子集对应的节点针对训练子集,执行目标模型的计算,以得...
  • 本申请提供了一种模型训练方法及装置。该方法包括:将目标模型的训练集划分为多个训练子集;其中,多个训练子集和多个节点一一对应;将多个训练子集中的每个训练子集发送至训练子集对应的节点,使得训练子集对应的节点针对训练子集,执行目标模型的计算,以得...
  • 本申请提供了一种模型训练方法及装置。该方法包括:第一节点从第二节点接收第二模型块输出的第一数据集;第一节点针对第一数据集,执行第一模型块的训练任务中的第一任务;第一节点从第二节点接收第二模型块输出的第二数据集;在第一节点针对第一数据集,完成...
技术分类