Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 公开了一种检测模型训练方法、装置、设备及存储介质,涉及信息安全领域。训练样本集中的多个样本包括第一样本,第一样本的多次迭代包括第n次迭代。在第n次迭代中,根据第一样本的多个变异规则,生成第一样本的多个变异样本。其中多个变异样本中的第一变异样...
  • 本公开提供一种深度强化学习模型调参辅助方法及装置,涉及人工智能技术领域。本公开通过学生智能体和教师智能体的协同调参机制,结合模型的历史版本的训练经验和当前版本的数据生成模型的调参方案,调参方案的生成过程具备明确的分析‑强化‑生成的自监督推理...
  • 本申请实施例提供一种智能催收机器人的训练方法、装置及电子设备,涉及计算机技术领域,用以适用于复杂多变的催收场景,并提升催收成功率。其中,方法为:获取至少一个对象模拟模型和初始催收机器人;基于至少一个对象模拟模型和初始催收机器人之间的催收模拟...
  • 本发明涉及机器学习技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种机器人强化策略优化方法、装置、设备及介质,获取机器人的运行状态信息,并根据运行状态信息与预先获取的环境图像构建高维状态观测向量;根据预设的神经网络策略模块对高...
  • 本申请公开了大语言模型强化学习训练的熵坍塌抑制方法、装置、设备及介质,涉及问答大语言模型技术领域,包括:确定目标策略模型在预设并行环境下进行强化学习训练时的当前熵值;若当前熵值大于预设熵值阈值,通过目标策略模型确定第一工具调用序列信息;确定...
  • 本发明涉及人工智能技术领域,尤其涉及一种基于智能体自监督学习的多智能体协作能力提升方法,该方法对于蒙特卡洛树搜索自精炼算法的任一次迭代,确定搜索树中在任一次迭代时被选中的父节点,记为目标父节点,获取目标父节点的历史访问总次数以及子节点价值集...
  • 本发明提供了一种大语言模型持续学习方法和系统,采用部署于企业内部环境的本地化大语言模型接收用户原始请求并生成内部应答反馈给用户,识别用户原始请求中的敏感信息元素并进行脱敏处理生成安全请求,发送给外部大语言模型并接收返回的外部应答,对外部应答...
  • 本发明公开的属于人工智能与机器学习技术领域,具体为一种多个大模型智能体的自我进化训练方法,包括具体步骤如下:S1,多样化结构化表达起步设计:在生成环节前,预先定义多种结构化表达形式;S2,多轨协作生成:多个智能体按角色分工,在预设的多种结构...
  • 本发明公开了基于动态软协作图的多智能体强化学习方法及系统,包括局部观测编码步骤及模块,协作图构建步骤及模块,信息融合步骤及模块,策略生成步骤及模块,联合训练步骤及模块,推理与执行步骤及模块;基于动态软协作图的多智能体协同强化学习方法及系统,...
  • 本申请提供一种大语言模型强化学习系统、强化学习方法及相关设备,系统包括:管理模块,用于对多类别价值函数进行统一管理和调用,具体包括:环境注册单元,用于建立全局注册表,存储环境函数与对应的元信息及与价值函数的映射关系;环境运行单元,用于根据唯...
  • 本发明公开的基于轨迹邻域信息序列优化的离线强化学习方法,包括根据上一状态st‑1,当前状态st,以及当前动作at,外展推断噪声Δst,计算反事实动作与当前状态的选择反事实动作的奖励;基于反事实动作网络分析当前状态st生成邻域动作基于状态预测...
  • 本发明属于计算机视觉领域,涉及一种基于Q模型的前瞻性视觉语言导航方法和系统。该方法包括:利用基线模型的全局编码器和局部编码器,获取基于历史信息的动作评分;构建用于预测未来信息的Q模型,并对Q模型进行预训练;利用预训练的Q模型抽取每个候选动作...
  • 本发明公开了基于奖励中心化的无人排雷装备智能体协作方法,将无人排雷装备作为一个智能体,构建此作战区域中的多智能体决策框架、多个无人排雷装备值网络中的奖励中心化机制和经验回放池;对基于奖励中心化的多智能体双延迟深度确定性策略梯度架构所构成的多...
  • 本申请提供了一种推理模型的训练方法、装置、电子设备及存储介质,该方法包括:根据初始训练数据,对基础模型进行微调,得到教师模型;其中,所述初始训练数据中包含第一长度的思维链数据;将所述初始训练数据输入所述教师模型,获取所述教师模型在多个时间步...
  • 本申请提供了一种金融数据质量校验方法,可应用于人工智能技术领域。该金融数据质量校验方法包括:获取来自多个金融业务系统的多源数据;从多源数据中提取多种类型的数据特征,多种类型的数据特征包括数值型特征、文本特征以及时间序列特征;将多种类型的数据...
  • 本发明涉及一种基于半监督图约束的缺失多视图对比学习方法及系统,该方法包括:获取视图样本集,每个视图包括完整视图和缺失视图,将视图数据集输入总体网络架构中对缺失视图进行恢复,以获取最终的聚类结果,其中总体网络架构的训练步骤包括:基于完整视图样...
  • 本发明涉及人工智能硬件领域,尤其涉及基于一种量子退火优化的神经网络训练方法,本发明方法包括:首先在图形处理器求得梯度,以神经形态编码生成能量系数;再按耦合阈值将权重划分子块,光学相干伊辛优化器输出初始自旋,量子退火处理器逆向退火得到最优自旋...
  • 本发明公开了深度学习的储能数据多维分析决策系统,包括如下步骤:通过数据采集模块获取多个物理量的实时传感数据,统一处理为标准化时间序列后,构建多维数据结构。系统引入无监督神经网络,采用Hebbian学习规则对神经连接进行局部权重更新,并在主特...
  • 本发明公开了一种面向异构分布式环境的大模型高效训练方法,属于人工智能与机器学习技术领域,通过对基座模型的权重系数冻结以及低秩适配模块的插入,在进行训练时仅需要训练低秩适配模块的参数,显著降低了计算量和训练难度,使得整个大模型训练任务形成分布...
  • 本发明涉及计算机视觉技术领域,公开了一种基于解耦教师模型的无源域自适应目标检测方法及系统,其中方法包括:通过教师模型‑学生模型网络架构执行无源域自适应目标检测训练,将教师模型和学生模型生成的伪标签进行组合得到集成伪标签;将集成伪标签用于反向...
技术分类