Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种融合语境知识的空管语音识别文本纠错方法及装置。所述方法包括:获取历史空管语音通话数据并进行预处理,得到对齐后多个候选文本序列,建立包含动态呼号集合和静态指令参数库的语境信息;构建融合语境知识的空管语音识别文本纠错模型;将对齐后...
  • 本发明公开了基于时空自注意力的音频指纹识别系统,涉及音频信息处理技术领域,具体包括以下模块:音频预处理模块、时空分解模块、特征提取模块、特征融合模块、时空重构模块以及指纹识别模块;本发明通过音频预处理模块对待识别音频数据进行预处理;时空分解...
  • 本发明涉及拾音识别技术领域,具体涉及基于声纹表征记忆的拾音识别方法及系统,该系统与方法通过通用声纹表征提取序列与动态声音特征提取序列的设置,在进行声纹表征记忆的拾音识别过程中,两者结合既避免了传统技术“全特征一次性提取”的资源浪费,又克服了...
  • 本发明公开了一种声纹识别模型的训练方法、装置及可读介质,包括:响应于确定在声纹识别模型的训练过程中所使用的损失函数为AMSoftmax或AAMSoftmax;对AMSoftmax或AAMSoftmax中的用于控制收敛程度的超参数m进行初始化...
  • 本发明提供一种基于声纹一致性验证的语音提取方法及其相关设备,包括:确定目标语音数据;加载目标语音者的质心数据,并对所述目标语音数据进行一致性验证处理,得到验证声纹数据;通过预设分离网络,对所述验证声纹数据进行分离处理,得到目标声纹数据;对所...
  • 一种装置,包括用于以下的部件:从一个或多个所捕获的图像的图像分析中获取基于图像的声源位置数据;将多麦克风音频编码为包括空间音频元数据参数的元数据辅助空间音频;将基于图像的声源位置数据编码在元数据辅助空间音频的一个或多个空间音频元数据参数内,...
  • 本发明公开了一种音频解码抗抖动方法、装置、电子设备、存储介质和程序,其中,该方法包括:确定待解码的音频数据的接收稳定性指标以及音频缓冲指标;根据所述接收稳定性指标和所述音频缓冲指标确定音频采样率的调整方式;按照所述调整方式对解码后的所述音频...
  • 本发明公开了一种基于音频能量的音频数据处理方法,通过获取预设位宽音频数据的音频参数;判断预设位宽音频数据的音频参数是否小于或等于预设能量比较阈值;判断出音频数据的数据类型,并根据数据类型对数据进行压缩或裁剪处理后形成较小的音频数据,再进行传...
  • 本发明涉及语音处理技术领域,可应用于金融科技和医疗健康领域,公开了一种语音数据处理方法、装置、设备及介质,方法包括:获取原始语音数据,对所述原始语音数据依次进行版权检测、标准化处理以及水印检测得到处理语音数据;对所述处理语音数据进行人声分离...
  • 本申请公开了一种音频水印嵌入方法、音频水印提取方法和模型训练方法,属于人工智能技术领域。该音频水印嵌入方法包括:获取水印数据和原始音频数据中需要嵌入水印的原始音频片段;将原始音频片段和水印数据输入编码器,通过编码器确定原始音频片段中至少两个...
  • 本申请涉及一种音频处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:通过目标对象标识发起音频交互后,启动音频信号采集;计算实时采集的音频信号对应的声纹向量,将计算得到的声纹向量与目标对象标识对应的目标声纹向量进行...
  • 本发明涉及人工智能技术领域,可应用于金融科技和医疗科技领域,公开了一种零样本语音转换方法、装置、设备及介质,该方法包括:获取源语音数据,并对源语音数据进行特征提取以获取源语音数据的内容特征和音高特征;获取目标人物参考语音特征,并将内容特征、...
  • 本申请提供了一种语音增强方法、设备及存储介质。该方法在不扩充语音增强模型的参数量和计算量的情况下,针对不同通话模式下的语音数据,只需加载与通话模式对应的语音增强参数到同一语音增强模型,就可以使用更新模型参数后的语音增强模型,实现对各种通话模...
  • 本申请提供一种基于隐空间薛定谔桥的语音增强方法、装置、设备及介质。本申请的方法包括:获取退化语音;通过目标编码器将退化语音编码为隐空间中的退化潜变量,目标编码器用于将不同类型的退化语音在隐空间中收敛至靠近对应的干净潜变量的分布,目标编码器具...
  • 本申请涉及语音处理技术领域,提供一种语音增强方法和语音交互设备,可以在两个麦克风的情况下较为有效地进行语音增强,降低硬件成本。本申请对语音交互设备的至少两个麦克风在第一时段采集到的唤醒词语音进行唤醒词降噪处理,得到至少两个降噪后语音;唤醒词...
  • 本发明公开了一种基于结构感知WaveGAN的声纹数据增强方法及装置,包括:获取工地环境中运行设备的声音信号,作为真实样本,并将声音信号转换为数据形式,得到真实信号数据;本基于结构感知WaveGAN的声纹数据增强方法及装置在损失函数设计上实现...
  • 本申请提供一种音频处理方法、装置、设备、介质及程序产品,应用于云技术、人工智能、地图领域、智慧交通、辅助驾驶等各种场景,该方法包括:获取目标音频帧和目标音频帧的目标基音频率;目标音频帧为经过风噪抑制处理得到;根据目标基音频率对应的至少两个目...
  • 本申请提出一种语音增强方法、装置、电子设备和存储介质,其中,方法包括:采集多路音频信号,根据所述音频信号进行噪声估计,得到噪声估计信号;根据所述音频信号和所述噪声估计信号确定语音信号;根据所述语音信号的语音功率谱密度和所述噪声信号的噪声功率...
  • 本申请公开了一种车内道路噪声的预测方法、装置、设备及存储介质,属于车辆噪声预测技术领域。该方法包括:获取车辆所在道路的第一参数;其中,第一参数用于表征路面的不平度;通过训练后的预测模型,基于第一参数、第二参数和第三参数预测噪声信息;其中,第...
  • 本发明提供一种基于人声特征提取的动态计算语音分离方法及其相关设备,包括:获取语音数据;对所述语音数据进行特征提取,并根据提取的特征数据生成复杂性评分;基于所述复杂性评分,确定退出点,并在所述退出点执行语音分离处理,得到分离语音数据以及对应的...
技术分类