Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明公开了一种基于深度学习的绿植花期监测方法、装置及系统,通过可学习卷积核实现可见光与近红外图像的跨模态动态增强,生成植被活性掩膜以精准定位植被区域;利用通道注意力机制结合掩膜加权融合光谱与纹理特征,抑制非植被噪声干扰;通过跨模态交叉注意...
  • 本发明提供一种基于卷积加注意力机制的手机端面部动作恢复语音系统,涉及语音处理技术领域,该系统包括数据采集模块、数据处理模块、模型训练模块和语音生成模块。数据采集模块调用手机加速度传感器实时同步采集面部加速度与语音数据并传输至电脑;数据处理模...
  • 本公开涉及一种条码识别平台的控制方法、装置、设备及介质,该方法包括:采集当前图像,并识别当前图像的当前图像特征;集参照图像,并识别参照图像的参照图像特征;其中,当前图像和参照图像是先后采集的两张相邻图像;判断当前图像特征与参照图像特征是否匹...
  • 一种基于加权得分标签分配的小目标检测方法,涉及计算机视觉。将预处理后待检测的图片及其对应的类别送入神经网络;对图片特征提取和特征融合,根据特征筛选样本框送入加权得分标签分配模块中;加权得分标签分配为样本框根据加权得分分配正标签和负标签;模型...
  • 本申请实施例公开了一种语音识别方法、装置、计算机设备及存储介质。方法包括:获取待识别语音;将待识别语音输入预设的语音识别模型,得到语音识别文本、语音识别文本的内容置信度以及领域置信度;根据内容置信度以及领域置信度判断语音识别文本的文本置信度...
  • 本发明提供了一种基于多重一致性的跨模态说话人提取方法及系统,获取包含目标说话人数据的混合语音信号和视频数据;对获取的混合语音信号进行音频编码,得到音频特征;对获取的视频数据进行一致性视觉特征提取,得到与目标语音在内容一致和身份一致的两种视觉...
  • 本发明涉及一种基于频率感知特征融合的图像语义分割方法及系统,属于计算机视觉技术领域。本发明在语义分割神经网络模型的特征融合过程中,自适应地去除上采样高层特征中的有害高频,并增强低层特征中的有益高频,从而提高特征融合效果,减轻特征不对齐问题,...
  • 本说明书实施例提供了语音数据的处理方法及装置、模型处理方法及装置、情感语音合成方法及装置。其中,通过获取目标发声对象的多条第一情感语音数据,并对至少一条第一情感语音数据的目标声音要素进行调整,得到第二情感语音数据,以便将该多条第一情感语音数...
  • 本发明公开了一种基于注意力机制的水声生物目标识别方法,属于水下目标识别技术领域。本发明提出一种注意力机制辅助的卷积神经网络模型用于水声信号目标识别,通过多头注意力机制,提取不同尺度空间的水声信号特征信息,来提高噪声干扰情况下的目标识别精度;...
  • 本发明提供了一种基于人流量和问题上报的动态公厕巡检方法、装置及设备,包括:获取目标区域内公厕点对应的人流量负荷情况和已上报问题清单;基于人流量负荷情况和已上报问题清单,结合公厕点对应的历史趋势片段库,生成公厕点对应的未来维护状况动态趋势;根...
  • 本申请提供了一种基于小波变换卷积的声纹识别方法、系统、终端及介质,所述方法包括获取当前说话人的待识别语音;基于待识别语音的声纹特性提取梅尔倒谱系数特征;将梅尔倒谱系数特征输入至已训练的声纹识别模型中以对梅尔倒谱系数特征进行特征提取,获取声纹...
  • 本发明涉及图像识别技术领域,公开了基于遥感图像的玉米幼苗识别方法、系统及相关设备,方法包括:获取遥感图像;使用包含预设场景的遥感图像对未包含预设场景的遥感图像进行场景填充,确定初始样本数据集;对初始样本数据集中每个遥感图像的预设场景进行标注...
  • 本发明涉及一种基于数字孪生的河道采砂管控方法,属于采砂技术领域,其包括以下步骤:分别建立河道砂厂、采砂设备和运砂车辆的数字孪生模型;将河道砂厂模型中的采砂区域划分为若干个采砂单元区;获取各采砂单元区初始存砂量,并将各采砂设备模型和各运砂车辆...
  • 本发明涉及图像处理技术领域,更具体地,本发明涉及一种用于工具柜的工具状态检测系统。所述系统包括:图像采集模块、最终特征区域获取模块、目标区域获取模块、损伤系数获取模块,首先采集若干个入柜图像以及出柜图像,对每个出柜图像进行聚类,获取每个出柜...
  • 本发明提供了一种钢材铁素体珠光体金相组织的识别方法,涉及计算机视觉技术领域,具体涉及图像处理技术领域。该钢材铁素体珠光体金相组织的识别方法包括:对待检测金相图像进行图像预处理,得到金相二值图像;提取金相二值图像中的珠光体区域,得到珠光体区域...
  • 本公开实施例提供了一种音频处理方法、装置、存储介质及电子设备。其中方法包括获取待处理音频,对所述待处理音频进行分段处理,得到多个音频段;将所述多个音频段输入至预先训练的音频分类模型中,得到所述待处理音频的全局分类信息和/或所述音频段的局部分...
  • 本发明涉及一种特气设备零件的检测方法及装置,检测方法包括获取目标图像;输入目标图像至预设零件检测模型进行检测,以获得检测结果;判断检测结果是否符合预设规则;在检测结果符合预设规则的情况下,生成合格信息;在检测结果不符合预设规则的情况下,生成...
  • 本发明涉及教学实验管理技术领域,尤其是一种基于YOLOv11的实验桌面物品自动化管理改进方法,包括:将多层感知机与通道注意力机制相结合,添加在YOLOv11的backbone中的每个C3K2模块后,以提升模型对长距离依赖和局部上下文的建模能...
  • 本发明公开了基于唇语增强的语音交互方法、装置、设备及存储介质,基于唇语增强的语音交互方法包括:基于唇部区域的图像序列提取唇语特征,对语音信号进行特征提取得到音频特征;将唇语特征和音频特征进行跨模态融合编码,生成包含视听信息的混合特征;将混合...
  • 本发明提供了一种基于弦轴扭矩—频率映射关系的数字化高通量调音系统及方法,包括:多模态扭矩传感模块,用于采集历史调音过程中钢琴弦轴标准频率下的弦轴扭矩数据;环境参数感知模块,用于采集历史调音过程中钢琴弦轴的环境参数数据;分布式数据管理云平台,...
技术分类