Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供一种模型训练方法、设备、存储介质及程序产品。该方法包括:确定目标模型的重计算模块,并确定所述重计算模块中多个算子各自的重计算比例;在前向传播阶段,根据所述多个算子的重计算比例释放部分输出激活值,并保留剩余的输出激活值至显存;...
  • 本申请公开了一种模型量化方法及装置,属于数据处理技术领域。其中,该方法包括:对大语言模型的权重矩阵进行量化,得到第一量化矩阵;根据权重矩阵和第一量化矩阵,确定低秩补偿矩阵;根据弹性连接参数的参数值和低秩补偿矩阵,对第一量化矩阵进行补偿,得到...
  • 本申请实施例提供一种模型幻觉缓解方法、程序产品、设备及介质,涉及人工智能技术领域。该方法包括:获取目标模型的问题集和初始答案集;输入问题集和初始答案集至评分模型,得到目标模型的所有类答案的平均分和初始答案集整体的平均分;其中,每类答案的平均...
  • 本发明提出了一种基于网络参数初始化的彩色全息图快速训练方法。如附图1所示,该方法包括三个步骤:第一步,将3D物体的蓝色通道的强度信息输入神经网络1,通过无监督训练方法使神经网络1输出3D物体的蓝色通道全息图;第二步,将3D物体的绿色通道的强...
  • 本发明公开了一种命名实体识别任务的带噪学习方法,以解决现有技术识别准确度低,泛化能力不足的技术问题。本发明首先采用两个预训练语言模型,根据分类损失划分训练得到一个低损失集和一个高损失集;然后,从高损失集中把分布外噪声分离出来;接着,在网络之...
  • 本发明公开了一种基于类别增强的实例依赖部分标签学习方法及装置,包括:首先,利用类别设定的增强方法对实例进行数据增强,以生成多个类别设定的增强样本;其次,利用查询网络和键网络对增强样本生成查询表示和键表示以便进行距离度量;然后,通过利用对比学...
  • 本发明公开了一种基于量测数据的自监督学习模型训练方法,涉及电力系统监测技术领域,该方法包括:将量测数据输入时序特征编码器进行处理,输出高维特征向量;基于量测数据的噪声水平和实时统计分布特征,动态生成掩码时序预测任务和特征对比任务;基于量测数...
  • 本发明公开了一种基于多尺度特征对比学习的工业设备故障半监督分类方法,包括:获取工业设备故障数据并预处理得到初始的标记数据和未标记数据,将所有数据送入半监督时频分类模型进行训练,先通过编码器输出数据特征,基于这些特征,在时域和频域分支上分别执...
  • 本发明涉及一种能源异构数据可信补偿AI模型的半监督训练方法和装置。该方法包括:对多源异构数据依次进行统一时序格式化、基于设备额定参数与暂态特征的规则校验、分配贝叶斯权重以及基于介质特性与设备动力耦合滞后响应特征的时序补偿;小样本标注下的教师...
  • 本发明公开了一种基于反向验证的多模态细粒度指令微调数据构造方法,包括:获取多模态原始数据,对多模态原始数据进行结构化解析,得到可验证的视觉证据;基于视觉证据生成细粒度指令,进而生成候选回答集合;针对每条细粒度指令的候选回答集合,结合可验证的...
  • 本发明涉及机器学习技术领域,具体为一种AI学习机的自适应学习路径生成方法。本发明,通过构建包含拓扑逻辑的学科知识图谱并结合知识点线性索引序列,捕捉用户答题行为中的连续错误模式以锁定知识掌握断层区间,利用图谱回溯机制精准定位引发错误的根源前置...
  • 本申请涉及一种面向异构无人机集群的路径规划方法及系统。所述方法包括:构建异构无人机运动模型、根据异构无人机运动模型通过马尔可夫决策过程构建领导者无人机‑跟随者无人机路径规划模型;生成多种训练环境;选择训练环境,进行训练;判断是否还有剩余未被...
  • 本发明公开了偏斜感知的轻量级流处理深度强化学习分区方法及系统,涉及深度强化学习领域,包括,在实时流式数据处理系统的分区器中设置路由表,存储近期数据元组的分区决策记录,并在后续数据元组到达时,根据所述路由表提供对应的分区结果;当所述路由表未包...
  • 本申请提供一种基于离线到在线强化学习的模型训练和调机方法、系统,所述方法包括:基于离线数据集获取离线训练数据集;基于各所述当前状态信息、所述动作信息、所述奖励函数和所述下一个状态信息对初始强化学习网络模型进行预训练,获取预训练后的强化学习网...
  • 本发明提供了一种类GRPO的自优化提示生成方法及系统,包括:利用大语言模型对输入的查询语句进行处理,生成一组候选输出,以形成输出群体;通过奖励模型对各个候选输出进行评估,获得各个候选输出对应的奖励评分;大语言模型基于各个候选输出对应的奖励评...
  • 本发明属于模型训练技术领域,尤其涉及一种基于强化学习框架隐式耦合的大模型训练方法、装置、计算机设备及存储介质,方法包括以下步骤:针对输入查询,利用当前策略模型生成多个候选响应,并对每个候选响应进行验证,获得对应的奖励信号;基于当前策略模型与...
  • 本申请涉及一种局部放电检测模型的优化方法、装置、设备、介质和产品。所述方法应用于边缘设备,包括:首先,基于待测设备当前时刻局部放电信号特征向量和局部放电检测模型的历史决策策略,构建当前时刻的第一检测特征矩阵,然后,将第一检测特征矩阵输入局部...
  • 本说明书实施例提供一种训练大语言模型的方法及装置,针对当前的大语言模型,可以基于GRPO强化学习的框架,设置评测要点集,利用自身对其输出和评测要点集的各条评测要点进行比较,从而确定模型奖励。如此,可以不设置额外的奖励模型,从而无需外部请求,...
  • 本发明属于人工智能安全技术领域,具体涉及一种基于鲁棒特征适配器的深度学习高效对抗训练方法及系统,包括以下步骤:S1、从主干网络预训练模型的特征空间中提取输入数据的深度特征;S2、在所述主干网络特征空间中生成对抗特征;S3、将所述深度特征与所...
  • 大模型优化方法与系统,包括数据预处理阶段、模型构建阶段和模型训练阶段;在数据预处理阶段,通过对海洋数据进行标准化处理、可信度标注及对抗样本生成,构建了具有正常样本数据和对抗样本试数据的训练数据集;在模型构建阶段,通过引入可信度加权损失函数,...
技术分类