Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本申请属于语音识别领域,公开一种语音信号中命令词的识别方法及相关设备,可以提高命令词识别的准确率。该方法包括:将目标连续语音信号输入语音识别模型,以得到音素序列路径集合以及所述音素序列路径集合中每个音素序列路径所对应的路径得分;若所述音素序...
  • 本公开提出了一种通话可视化模型生成和通话可视化处理方法、装置,包括:响应于通话可视化请求,获取当前通话已生成的通话数据和初始DENN模型,并基于通话数据生成结构化文本数据;进行语义分析,以生成语义特征数据;对语义特征数据进行处理,以生成多头...
  • 本发明涉及生长状态评估技术领域,公开了一种基于多维度监测的作物生长状态评估方法及系统。该方法:按照作物生育期采集农田区域的多源遥感数据,并对所述多源遥感数据进行地形校正,得到目标植被数据;基于所述多源遥感数据提取农田地块边界并构建农田空间关...
  • 本发明公开了一种基于语音识别的多语种全语音处理方法、设备及介质,涉及语音识别技术领域,包括,基于多语种语音特征集,计算语种显式轨迹,并通过历史会话中的语种偏好信息与语音片段进行关联构建语种隐式轨迹,整合生成语种权重轨迹;将语种权重轨迹划分为...
  • 本申请涉及互联网技术领域中一种语音识别方法及装置、设备、介质,所述方法包括:持续接收音频信号片段传输给第一缓存,每次取出该缓存中所有音频信号片段进行分帧后特征表示,将所得的多个音频特征帧传输给第二缓存;每当第二缓存中累计接收到第一帧数的音频...
  • 本申请公开一种车辆场景下抗干扰声纹识别系统、方法及电子设备,涉及语音识别领域,包括:语音采集模块,通过麦克风阵列实现定向拾音;声纹注册模块,用于采集并存储多场景下的车主唤醒词语音样本;声纹建模模块,基于GMM‑UBM框架构建并训练声纹模型;...
  • 本申请涉及口语表达能力AI评测方法、装置、设备及介质。所述方法包括:对原始语音信号进行多粒度特征解耦处理得到声学、语言学和副语言学特征集合;基于共享底层编码器和任务特定专家网络生成各评分任务的特定特征表示;构建可微分评分规则图以量化任务间关...
  • 本发明公开了一种溺水人员检测方法、装置、设备及存储介质。包括:获取海面图像样本,根据海面图像样本建立目标检测模型,其中,目标检测模型中包括海面图像样本和人体相关信息的对应关系;获取指定海面区域的待测图像,根据目标检测模型确定待测图像的人体相...
  • 本申请提供了一种语音合成的方法,该方法包括:获取用户输入的目标文本,目标文本包括目标语种的至少一个单词,每个单词由辅音字母组成;根据目标文本,通过第一模型确定目标文本中至少一个单词的上下文语义信息;根据至少一个单词的上下文语义信息,通过第二...
  • 本发明公开一种语音编辑方法、装置和电子设备,通过获取待合成文本、原始文本及原始音频的原始频谱特征。根据待合成文本、原始文本、原始频谱特征及时间戳,获取待合成文本对应的重构掩码频谱特征及对应的噪声。将重构掩码频谱特征、噪声、待合成文本及原始频...
  • 本发明属于模式识别领域,公开了一种用于水下目标识别的融合模型,包括:信号预处理工作;提取音频信号中的特征组成本发明的数据集;将数据集按照8:1:1的比例划分为训练集、验证集和测试集;基于改进的MobileViT主干网络和基于多频谱注意力机制...
  • 本发明提供一种人机协同方法、系统、电子设备及存储介质,服务器在控制台发送的控制指令为语音驱动模式下,利用双通道实时语音编码器对用户的音频数据流进行双通道并行编码,得到第一文本和韵律‑情感向量;对第一文件进行切分得到多个文本片段,根据每个文本...
  • 本公开涉及用于故障诊断中增强型数据生成的系统和方法。一种生成音频以获得经操纵的音频数据的方法包括:接收与设备的操作相关联的音频的文本描述;接收与设备的操作相关联的音频数据;基于文本描述,生成与设备的操作相关联的音频特征的描述性文本输入;基于...
  • 本发明公开了一种基于CLIP语义引导的盒监督覆盖件异常分割系统及方法,属于工业自动化与质量控制技术领域,解决像素级掩码标注成本高昂与盒监督方法缺乏语义理解的问题,包括:S1、采用共享的预训练CLIP视觉骨干网络,提取输入图像的多尺度视觉特征...
  • 本发明涉及语音识别技术领域,具体涉及一种基于大语言模型的双编码器语音识别方法。包括获取原始音频数据;训练基于音素微调的音频编码器;通过双编码器融合结构提取语音特征,其中Whisper编码器分支提取声学特征,Wav2vec2编码器分支提取音素...
  • 本发明公开一种基于人声分离与修复的K歌音频处理方法,包括:获取K歌音频信号的时频矩阵,并判断K歌音频信号中是否存在噪声成分;识别噪声基矩阵和有效音频基矩阵,计算不同频段上噪声和有效音频的重叠系数,并确定交叉频段;根据噪声基矩阵和对应的激活矩...
  • 本申请公开了一种车载回声消除方法、装置、设备及存储介质,涉及回声消除技术领域,包括:获取语音信号和参考信号;通过自适应滤波器对语音信号和参考信号进行处理,得到残差信号;通过神经网络对语音信号、参考信号和残差信号进行处理,得到去回声的语音信号...
  • 本申请涉及一种基于施工进度的采购运输决策方法和系统,其中,该方法包括:基于WBS施工任务的施工进度,生成需要采购的BIM模型构件清单,并驱动企业项目结构进行资源分配,得到清单中各个构件所属的EPS业务项目;基于构件所属的WBS施工任务、EP...
  • 本发明公开了一种基于音视频的多模态语音增强系统,该增强系统包括数据采集模块,通过麦克风采集目标音频以及背景噪声和干扰音;利用摄像头同步采集环境视觉信息,包括说话者的面部表情和口型,对噪声和干扰音进行归一化处理,确保与目标音频的动态范围匹配;...
  • 本公开提供了一种火电机组状态检修优化方法及装置、电子设备和存储介质,涉及火力发电技术领域,通过采集火电机组中多个关键设备的运行状态数据,基于该运行状态数据构建设备健康指数模型并计算每个关键设备的健康指数,在任一关键设备健康指数低于预设阈值时...
技术分类