Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本申请涉及缺陷识别技术领域,其具体地公开了一种基于视觉检测的绝缘材料表面缺陷识别方法及系统,其通过对绝缘材料原始表面图像进行基于双重图像分解的反射抑制和纹理基元分离,以生成缺陷特征更为突出的绝缘材料缺陷显性化图像,并通过对绝缘材料缺陷显性化...
  • 本发明提供一种基于无人机的风力涡轮叶片雷电接收器检测方法及装置,所述方法包括:获取无人机捕获的风力涡轮叶片图像,基于所述风力涡轮叶片图像确定待检测图像;将所述待检测图像输入至训练好的目标检测模型中,所述目标检测模型为YOLOv8深度学习模型...
  • 本发明具体涉及一种融合运动一致性识别与热力图回归网络的LEO卫星方向单位矢量估计方法,利用一种融合多尺度梯度感知卷积、自适应特征重构与语义对齐跳跃连接的语义分割模型,针对恒星点源与LEO卫星拖尾的形态差异进行编码‑解码优化,并通过双分支耦合...
  • 本发明提供基于MFCC的ResNet模型用于声带疾病分类的方法、系统、装置、介质及程序产品,涉及声带疾病分类领域。步骤S1)采集受试者的发音,构建相对应的标签,并对受试者的发音进行预处理;步骤S2)将标准化的发音数据集转化为三维梅尔频谱特征...
  • 一种用于膏药制作的低温加药方法及系统,其获取由摄像头采集的预定时间段的丹油混合物的状态监控视频;采用基于深度学习的人工智能技术,挖掘丹油混合物的状态监控视频中关于丹油混合物的状态时序动态变化特征信息,以此来进行丹油滴入水中的时机判断评估,从...
  • 本发明提供了一种霉变等级评估方法和装置。其中,厨电设备中预先训练有语义分割神经网络模型,该方法包括:采集厨电设备的内腔图像;将内腔图像输入至语义分割神经网络模型,输出二值化掩膜;融合二值化掩膜和内腔图像的像素信息,得到霉斑的多维度视觉特征;...
  • 本发明公开了一种基于图像识别的变电站智能巡检点位自动定位方法及系统,方法包括:利用移动摄像头实时采集多角度图像,对多角度图像进行增强处理,获取适配变电站设备的增强图像序列;基于增强图像序列,采用特征匹配算法与预先建立的变电站摄像头点位类别模...
  • 本发明公开的一种多视角手势识别方法,包括:在手势交互空间内安装至少两台用于采集手部3D信息的TOF传感器;通过每一台TOF传感器实时采集手势交互空间内每一视角下的红外IR图像和深度图像;对采集到的红外IR图像进行检测处理;对每一视角下的手部...
  • 本申请提供了一种多模式的音乐节奏多维度感知与效果生成展示方法及系统,属于人工智能和多媒体交互技术领域。该方法包括:确定运行模式为节奏生成模式或节奏展示模式。节奏生成模式基于用户输入和/或系统自动分析结果生成节奏信息。节奏展示模式则将预先或实...
  • 本发明公开一种基于全局‑局部协同图卷积网络的人体行为识别方法、装置及介质,涉及计算机视觉领域的人体行为识别技术领域。该方法包括:获取骨架数据,并对所述骨架数据进行预处理,得到四种模态的输入数据;将所述四种模态的输入数据分别输入至四个信息流子...
  • 本发明涉及图像识别和计算机视觉技术领域,尤其涉及基于人工智能的起重机复杂场景障碍物识别方法及系统,通过安装在起重机上的彩色摄像头和深度摄像头同步采集环境图像数据,对彩色图像进行光照补偿,对深度图像进行噪声滤波并完成空间对齐,生成彩色深度融合...
  • 本发明公开了一种基于无人机影像的坡面侵蚀监测方法,包括:通过无人机采集多角度影像序列,提取初始坡面轮廓数据,获得坡度比值初步估计值对坡面模型进行校正,获得变形校正后的模型,并提取裂缝分布坐标集;将裂缝分布坐标集与坡度比值匹配计算,分析偏差并...
  • 本发明公开了一种基于缝合线优化的海底图像拼接方法,包括:基于改进ResNet50网络对目标海底图像进行双阶段特征提取,得到包含全局结构信息与局部细节特征的多层次特征图;基于可变形卷积网络分别对第二特征图与第一特征图进行全局粗配准和局部细校正...
  • 本发明公开了一种多模态信息交互的弱监督场景理解方法、系统及设备,包括如下步骤:根据输入图像和指代表达式提取初始视觉特征与初始文本特征;将初始视觉特征与初始文本特征映射至共享语义空间,对初始文本特征和初始视觉特征进行相互感知与对齐,获得文本感...
  • 本公开提供了一种关键点检测方法、神经网络、装置、电子设备及存储介质,该方法包括:获取包括任一类别的待检测对象的待检测图像、和至少一个参考图像;其中,所述参考图像与所述待检测图像包括相同类别的对象,且所述参考图像携带有参考对象的多个参考关键点...
  • 本申请公开了一种用于多说话人的语音分离方法、装置、设备及存储介质,涉及人工智能领域。该方法包括:获取视频中的视频帧数据和音频帧数据;从所述视频帧数据中获取人脸区域数据;从所述人脸区域数据中获取口型变化数据,基于所述口型变化数据提取出语义嵌入...
  • 本发明公开了一种跨模态人脸识别方法、装置、设备、存储介质及程序产品。该方法包括:获取多模态的人脸图像数据集,人脸图像数据集中包括可见光图像和红外图像;在可见光图像的三通道中随机选择任意通道替换其他通道生成增强图像,并根据增强图像以及人脸图像...
  • 本申请涉及一种语音识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待进行身份认证的目标用户的目标视频,并基于目标视频提取多个数据集,各数据集包括目标用户的声音片段和目标用户的脸部图像,且,各数据集中的声音片段和脸部图...
  • 本发明涉及一种子弹壳表面缺陷检测方法及图像训练推理一体化平台,包括将子弹壳360度原始拍摄图像展开平面图像并进行预处理;设计数据增强策略进行样本扩增;提取子弹壳表面缺陷目标的特征并处理,进行Anchor重聚类,增加小尺寸Anchor框的数量...
  • 本发明公开了基于声纹特征提取的换流阀工况诊断方法、装置及设备,涉及高压直流换流阀工况诊断技术领域。本发明方法包括获取高压换流阀的运行状态原始音频数据,对采集到的声音信号进行分帧、加窗和归一化预处理;使用盲源分离算法,实现混合声信号中的各类源...
技术分类