Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明公开了一种基于多模态的多语言自定义指令识别方法和系统,包括:步骤S1:构建多模态大模型并对该模型进行训练,其中,多模态大模型构建支撑输入处理单元、查询输入处理单元和度量判别器;步骤S2:在步骤S1的基础上,注册用户自定义语音指令;其中...
  • 本发明提供一种基于图像检测的茶叶品质分级系统及方法,涉及图像处理技术领域,本发明通过融合光照均匀度因子与色温偏移量的双因子补偿体系,在特征提取阶段实施动态调制:针对光照不均对空间特征基准系数集进行形态增强系数的线性放大与纹理敏感系数的指数衰...
  • 本发明属于计算机视觉、视觉‑语言匹配检测、多模态目标跟踪领域,公开了一种自适应视觉‑语言匹配检测与跟踪方法。首先利用预训练多模态大模型的模态对齐与表征优势,构建视觉‑语言多模态跟踪大模型;并提出视觉上下文感知提示学习算法,从当前搜索特征中提...
  • 本申请公开了一种对抗攻击图像生成方法、装置、设备及存储介质,通过选择特定的对抗噪声图案以及干净样本作为生成器的输入,基于对比学习的相似性对比损失,在破坏干净样本的低级特征的同时学习适应样本的高密重复性特征,使得训练后的生成器输出的对抗样本获...
  • 本申请提供了一种音频处理方法、装置、电子设备、计算机程序产品及计算机可读存储介质;方法包括:显示音频处理界面,其中,音频处理界面包括第一录音控件;响应于针对第一录音控件的触发操作,采集第一音频信号;响应于第一音频信号包括多个音量跳变点,输出...
  • 本发明公开了一种基于航迹保持的无人机热红外图像拼接方法与系统,涉及图像拼接技术领域,包括步骤:构建图像集合;获取任意一对待拼接无人机的热红外图像各自匹配的特征点,通过待拼接热红外图像的相似变换矩阵与匹配的特征点的重投影误差生成对齐项;计算任...
  • 本发明提出了一种失物找回方法,所述方法包括:获取所述失物对应的失物方发出的第一标识信息;当存在与所述第一标识信息相匹配的第二标识信息时,向所述失物方发出表征匹配成功的提示信息,所述第二标识信息为拾物方所发出。本发明提高了失物寻回的效率。
  • 本公开提供一种监控方法、装置、监控设备及存储介质,其中,监控方法包括:在图像采集模块启动后,通过图像采集模块采集监控对象的图像数据并存储;在AI检测模块启动后,基于AI检测模块的启动完成时刻以及存储的图像数据中的第一帧图像的时间戳,获取目标...
  • 本发明涉及语音处理技术领域,具体涉及一种从源情感到目标情感的情感语音转换方法及装置。本发明的方法包括:步骤一:获取带源情感的语音数据Voice1、带目标情感的语音数据Voice2;步骤二:分别对V...
  • 本申请提供了一种模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:通过第一模型对第一语音样本进行语音对话识别,得到第一识别结果,并基于第一识别结果对语音识别网络进行参数更新,得到第二模型;通过第二模型对第二语音样...
  • 本发明公开了一种基于可控图像生成的行人关联特征增强方法,属于计算机视觉技术领域,包括以下步骤:S1:基于待关联行人图像和预训练的可控图像生成模型,获得多张选定目标姿态行人图像;S2:提取所述待关联行人图像和所述多张选定目标姿态行人图像的行人...
  • 本发明公开了一种虚拟语音的生成方法、装置、存储介质及电子装置。其中,该虚拟语音的生成方法包括:通过获取多个不同的语音文本样本及语音属性信息,多个不同的语种语音文本样本中的每个语音文本样本对应一个语种,一个对象;将每个语音文本样本输入多流编码...
  • 本申请提供一种基于多源信息融合的智能物流调度系统及方法,涉及物流调度技术领域,通过物流任务的执行状态特征和调度策略确定调度资源对物流任务的协同适配度;将运输资源划分为多个资源分配单元,确定各个资源分配单元之间的资源协同关系,根据资源协同关系...
  • 一种航空发动机卡箍的细粒度三维识别方法,包括:采集标准航空发动机三维点云数据,以其中卡箍点云数据作为卡箍形状和位置标准,并为每个卡箍定义型号标准;对待测航空发动机三维点云数据,首先进行卡箍场景的语义分割,通过语义分割网络学习每个点的局部几何...
  • 本公开提供了一种业务处理方法及装置、电子设备、存储介质、程序产品,该方法包括:根据第一对象在第一业务过程中的通话语音数据进行情绪识别,得到第一对象的情绪识别结果;根据通话语音数据进行意图识别,得到第一对象的意图识别结果;根据通话语音数据在预...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的语音处理方法、装置、计算机设备及存储介质,包括:接收用户通过语音设备输入的语音指令;基于语音编码器对语音指令进行特征提取得到语音特征;基于语音适配器对语音特征进行调整处理得到目标语音特征;基...
  • 本发明公开了一种基于深度神经网络的多阶段语音增强方法。该方法包括以下步骤:首先,将低信噪比语音信号输入基于信噪比渐近学习的语音增强模型中以提高信噪比,随后对语音增强模型的中间输出结果进行准确性更高的基频估计,基于基频估计生成梳状滤波器,滤波...
  • 收集医学图像细胞的图像数据,标注筛选后的图像数据;对图像数据进行预处理和对数据集进行划分,对主干网络进行及特征融合网络进行修改,将训练集送入到网络模型进行训练;验证集验证训练的结果且更新网络模型的权重文件,得到细胞的图像检测模型的最优权重文...
  • 本发明公开了一种基于空谱双流网络的高光谱图像语义分割方法和装置,包括以下步骤:步骤S1、获取高光谱图像语义分割标准数据集;步骤S2、将所述高光谱图像语义分割标准数据集输入到空谱双流网络进行语义掩膜预测训练,得到预测网络;步骤S3、将待处理的...
  • 本申请公开了一种用于对精子分类模型进行训练的方法及其相关产品。该方法包括:获取第一精子视频,其中所述第一精子视频为至少一个精子的活动视频;对所述第一精子视频进行预处理,以获得至少一个第二精子视频,其中所述第二精子视频为单个精子的活动视频;对...
技术分类