Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请属于人工智能技术领域,具体涉及一种大语言模型的数据处理方法、大语言模型的数据处理装置、计算机可读介质、电子设备以及计算机程序产品。该方法包括:获取由大语言模型输出的推理结果,所述推理结果包括当前推理文本和后序推理文本,所述当前推理文本...
  • 本发明提出了一种脉冲编码调制PCM栅格布局方法和系统。该方法包括:基于参数的采样率与PCM帧采样率,确定PCM栅格的初始子帧长度和初始子帧数量,以作为初始状态;建立用于搜索最优占空比的马尔可夫模型,其中,马尔可夫模型包括状态、动作和奖励函数...
  • 本发明公开了一种非线性与暂态负载下构网型功率变换器虚拟阻抗调度的多目标强化学习方法及系统。该方法包括确定多目标强化学习智能体的观察状态向量,所述观察状态向量包含电压谐波失真、电流导数、阻抗偏差指标和负载行为统计指标的状态空间;控制动作空间,...
  • 本申请涉及一种多智能体深度强化学习方法、装置、设备和介质,涉及强化学习技术领域。所述方法包括:针对严肃游戏场景中的多智能体协同决策问题,构建多智能体强化学习模型;基于多类型先验策略引导和策略熵的自适应课程学习机制对模型进行训练;训练交互过程...
  • 本发明涉及一种大语言模型强化学习方法,包括以下步骤:S100、获取由策略模型基于输入问题生成的多个输出序列,获取各个所述输出序列对应的结果奖励;S200、获取各个所述输出序列对应的熵奖励;S300、基于所述结果奖励,获取各个所述输出序列对应...
  • 本发明公开了一种船舶故障诊断模型的训练及在线诊断方法及系统,该方法包括:基于多源域与目标域数据生成动态权重;利用该权重指导特征提取器与域判别器进行对抗训练以学习域不变特征;融合加权后的监督损失与域对抗损失,并结合目标域正则化项优化模型;通过...
  • 本发明涉及一种多智能体对抗学习方法,多智能体包括至少两个生成智能体和1个评价智能体,该方法包括:将问题描述文本输入到各个生成智能体中,并将各个生成智能体的输出文本输入到评价智能体中,得到评价智能体对各个输出文本的评价;接着,构建新的记忆,并...
  • 本发明公开了一种基于生成对抗与置信度加权的联邦原型对比学习方法与系统。方法包括:客户端基于本地不平衡数据集训练条件生成对抗网络,为少数类生成合成样本,并构建增强数据集;在增强数据集上通过局部对比学习损失和全局引导几何约束损失训练本地特征编码...
  • 本发明涉及人工智能技术领域,公开一种基于因果蒸馏与结构化损失函数的知识迁移方法及系统,该方法包括:基于教师模型构建因果图,并基于因果图,通过因果干预运算提取教师模型的因果表示;基于因果表示,构建因果蒸馏损失;构建结构化损失函数;将因果蒸馏损...
  • 本发明提出一种基于多源融合优化的近红外模型跨设备应用方法,旨在解决高精度近红外光谱仪所构建的各类神经网络模型在迁移至便携式设备过程中,因光学系统结构、波长范围、信噪比及仪器响应特性等差异导致的模型性能下降问题。本发明将近红外光谱数据与常规质...
  • 本申请提供一种大模型参数高效微调方法,包括:获取大模型;遍历所述大模型中的各目标层,针对所述各目标层分别构建低秩克罗内克分解矩阵;构建所述各目标层共享的可训练调制参数;基于所述低秩克罗内克分解矩阵和所述可训练调制参数,对所述大模型进行微调。...
  • 本公开提供一种模型训练方法、召回链路构建方法及其装置、存储介质。模型训练方法包括:构建用户画像,其中用户画像包括用户的基础属性数据,和用户的前n个历史行为的编码样本序列,n为正整数;生成提示模板,其中提示模板包括用户的基础属性数据、用户的前...
  • 本发明公开了一种基于交替适应动量优化的模型训练方法及系统,解决了现有的基于自适应优化算法的模型训练方法导致大规模矩阵优化的内存效率低下,无法支持更大规模模型的训练的技术问题。方法包括获取初始模型参数并标记为叶子节点,构建用于存储一阶动量的梯...
  • 本发明提供了一种节点与边联合特征学习的图卷积模型及在ADHD诊断中的应用。模型包括双图构建模块:用于将脑功能连接网络表示为节点图和边图;联合特征学习模块:由交替堆叠的优化节点层和优化边层组成,用于对双图构建模块输出的节点图和边图进行特征嵌入...
  • 本发明公开了一种自适应分布式训练优化方法,属于分布式深度学习训练技术领域,包括以下步骤:S1、通过数据采集模块在分布式训练过程中实时采集迭代性能数据;S2、速度变化检测模块检测系统性能是否出现显著波动;S3、启动问题定位模块判定性能退化的具...
  • 本发明公开了一种基于弹性权重巩固和动态聚合的弹性联邦学习方法及其系统,包括以下步骤:初始化模型参数,设定最大通信轮数和每轮通信中客户端预设的本地训练步数;服务器将当前的全局模型参数发送给选定的客户端,客户端接收后将其作为本地模型并进行更新;...
  • 本发明属于联邦学习相关技术领域,其公开了一种基坑预测模型训练方法、基坑监测方法及系统,训练方法包括:边端设备对其进行本地训练,使模型基于当前时段的基坑信息预测未来时段的基坑状态;本地训练损失为考虑数据拟合损失以及物理约束损失的综合损失;边端...
  • 本发明实施例公开了一种智能体的策略更新方法与系统,所述方法包括:提取环境状态特征并获得智能体的基础行为;基于所述环境状态特征、所述智能体的基础行为构建行为树与策略模型;基于智能体与环境交互产生的交互数据训练所述策略模型以获得优化策略;基于所...
  • 本申请涉及一种大模型工具调用方法、装置、设备、存储介质和程序产品。方法包括:基于完整工具集中各工具的功能、所需参数、输出结果及与用户查询请求之间的关联,识别工具之间的依赖关系,确定工具调用关系和调用路径;根据文本向量,对完整工具集中的工具进...
  • 本申请涉及一种KV缓存优化方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:计算输入至大语言模型的文本输入序列中每个元素对应的键向量和值向量;通过多头潜在注意力机制,对键向量和值向量进行低秩联合压缩得到潜在向量,将潜...
技术分类