Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明实施例公开了一种联邦学习聚合节点选择方法、系统、设备、介质及程序产品,涉及大数据技术领域。该方法包括:在第t轮的局部模型聚合完成后,若满足聚合节点评估条件,则根据每个候选聚合节点的总信用评分以及候选聚合节点的可靠性评分,确定候选聚合节...
  • 一种密态联合建模的方法、系统与计算设备,涉及驱动代理以及多个参与方,驱动代理根据大语言模型构建,每个参与方均包括参与代理、数据库以及计算节点,多个参与方的计算节点连接组成密态计算网络,驱动代理响应于用户的任务描述,确定数据配置和训练任务配置...
  • 本发明公开了一种模型训练方法及装置,该方法包括:根据模型测试计划和目标训练模型的当前训练状态,判断目标训练模型是否满足模型测试条件;若满足,则对目标训练模型进行复制,得到至少一个目标测试模型;对目标训练模型进行模型训练,同时,对目标测试模型...
  • 本公开提供一种多阶段联邦学习方法、装置、设备、存储介质及程序产品,包括:获取中央聚合平台下发的初始化模型参数;基于初始化模型参数和本地车辆相关数据训练得到一阶段本地模型;获取中央聚合平台下发的一阶段全局模型参数,利用分布感知逻辑调整机制基于...
  • 本发明涉及一种硬件算力感知的模型自适应动态压缩与分布式系统,面向异构边缘设备的联邦学习场景,进行硬件感知的智能模型部署,首先需要构建硬件感知模型适配器,通过多维硬件特征评估和动态压缩策略生成与设备能力匹配的模型结构;然后,执行知识蒸馏增强的...
  • 提供了一种分布式数据并行训练的方法和设备。所述方法包括:在第一训练轮次期间,通过多个计算节点之中的第i计算节点的第i加速器基于训练数据集中的第i训练数据子集执行神经网络的对应副本的训练,其中,所述多个计算节点中的每个保存所述神经网络模型的对...
  • 本公开涉及计算机技术领域,涉及一种渲染模型的训练方法及装置、光照渲染方法及装置、计算机程序产品和电子设备。该训练方法包括:基于教师模型从图像帧样本中提取待渲染对象的固有属性信息和全局光影信息;利用初始学生模型对高斯基元进行特征解码,得到基础...
  • 本发明公开了一种基于置换策略网络的移动多智能体知识迁移方法,涉及多智能体强化学习技术领域。包括:将置换不变性策略网络与置换同变性策略网络嵌入超网络框架,通过超网络动态生成输入层与输出层权重矩阵,建立联合状态‑动作空间与智能体规模、环境变化的...
  • 本发明公开了一种基于宽度学习的自然语言理解模型训练方法及系统,包括以下步骤:对训练数据进行预处理;将基于Transformer架构的预训练语言模型与宽度学习融合,得到融合模型;将训练数据作为基于Transformer架构的预训练语言模型的输...
  • 本发明涉及深度神经网络安全领域,尤其是涉及一种基于梯度对齐对抗蒸馏的黑盒攻击方法。包括以下步骤:步骤1:设计梯度差最大化的样本扰动生成器;步骤2:为替代模型设计梯度对齐对抗蒸馏建模框架;步骤3:交替训练替代模型和扰动生成器;步骤4 : 基于...
  • 本发明涉及一种有序多人Stackelberg纳什博弈的逆强化学习算法,包括建立专家玩家的Stackelberg纳什博弈系统,并设计惩罚函数;基于最优化控制理论;建立学习者玩家的Stackelberg纳什博弈系统;设计基于模型的逆强化学习算法...
  • 本发明提出一种面向混合博弈稀疏奖励的分布式多智能体强化学习方法,解决动作空间庞大、奖励稀疏及拟人性差的问题。通过多服务器部署游戏环境、AI服务器和强化学习训练器,搭建分布式训练框架,实现并行数据采集与梯度同步,提升训练效率。将复合动作拆分为...
  • 本发明属于人工智能与自然语言处理技术领域,公开了基于GRPO奖励函数的NL2SQL模型训练和存储方法及装置。本发明构建了高质量的训练数据集,结合语法校验、执行验证及语义一致性筛选,有效提升模型的训练效果与生成性能;本发明采用GRPO作为基础...
  • 本发明属于金融科技与人工智能交叉技术领域,公开了金融数据驱动的多模态大模型强化学习训练方法及装置。本发明利用GRPO实现了多模态模型对股票图具体准确的分析;设计动态奖励函数,通过匹配格式标签、文本语义相似度和分段奖励机制三重反馈优化模型输出...
  • 本发明提供一种问答大模型训练方法、问答方法、装置、设备及存储介质,涉及人工智能技术领域,其中方法包括:获取待训练的问答大模型及问题样本集;所述问题样本集中包括多个难度等级的问题样本;对于所述问题样本集中的每个所述问题样本,获取所述问题样本的...
  • 本申请提供一种基于强化学习的异常检测多模态大模型训练方法和装置。本申请提供的方法:异常检测多模态大模型的编码器基于交叉注意力机制提取综合特征,基于综合特征预测样本图像与检测指令对应的异常标签和推理过程文本;计算推理过程文本的每个最小文本单元...
  • 本发明提供一种智能计算中心云平台通过算力进行嵌入链自奖励信号的强化训练方法及装置,涉及智能计算中心、智算中心、算力基础设施和智算云技术领域,该方法包括:步骤S1、基于初始策略模型对第一问题进行预测,得到多个预测回答;步骤S2、通过预设参考模...
  • 本发明提供了一种基于多模态数据的强化学习模型的训练方法及相关设备,可以实现文本、图片、结构化数据的跨模态语义融合,突破传统单模态处理局限。该方法包括:获取驾培行业所对应的外部数据、互联网生态数据以及内部业务数据;对外部数据、互联网生态数据以...
  • 本申请属于人工智能技术领域,涉及一种模型强化微调方法、装置、设备及其存储介质,通过获取目标数量的任务演示数据;输入到构建完成的目标模型中,对目标模型进行离线初始训练,得到模型策略初始化后的目标模型;获取实时采集的任务指导数据;输入到模型策略...
  • 本申请公开了一种决策模型训练方法、装置、设备及介质。所述方法包括:获取策略互动中与非合作方的多局竞争中的历史对局数据;利用同策略多智能体优先经验回放算法选取目标训练样本集并根据目标训练样本集对多个预设模型进行迭代训练;利用联盟学习算法将多个...
技术分类