Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于预训练语音模型的多语种声纹识别方法,利用预训练语音模型WavLM与传统声纹识别模型ECAPA‑TDNN相融合。本发明引入多层感知机(MLP)模块,用于进一步提炼和转换WavLM提取的特征,使其更适合于ECAPA‑TDNN...
  • 本申请实施例提供一种声音来源判断方法及系统,所述方法在获取声音信号、振动信号等多模态检测信号后,可以根据多模态检测信号生成能量包络信号、经过滤波的振动信号以及瞬时生理响应特征等特征信号,再通过分窗处理将特征信号划分为多个分析窗口,以及基于分...
  • 本发明属于排水管道检测技术领域,具体为一种排水管道内部缺陷的声纹识别检测方法,包括以下步骤:S1:通过声学传感器阵列采集管道内声音信号;S2:对采集的声音信号进行预处理,包括噪声滤波、信号增强和分段处理;S3:提取声音信号的时域、频域和时频...
  • 本发明实施例公开了一种语音处理方法、系统及智能眼镜,所述方法包括:接收到不同声源的第一语音信号和第二语音信号后,将第一语音信号和第二语音信号合成为双声道信号,对双声道信号中的第一声道信号和第二声道信号分别进行语音处理得到第一语音信号和第二语...
  • 本发明公开了一种基于动态采样的音频编解码方法。编码方法包括:首先通过综合分析信号的多维时域特征,并结合动态更新的阈值,来准确判断信号的实时复杂度;然后,根据判断结果自适应地确定当前最佳的目标采样率;最后,对离散化信号进行重采样以生成不同采样...
  • 本发明提供了一种神经语音压缩方法及系统,其中方法包括:获取原始语音数据,将原始语音数据通过编码器进行编码,得到隐藏向量;将隐藏向量输入至分层残差矢量量化模块,将隐藏向量量化为基于多尺度并行token流的离散化编码;将离散化编码输入至解码器进...
  • 本申请提供一种适配鸿蒙平台的音频编解码方法、装置、系统及终端设备,在鸿蒙平台上部署核心适配层,核心适配层内部集成有多种不同的编解码器适配器,编码时,获取PCM音频数据,传入核心适配层;确定出当前的编码策略,进一步确定出目标编码器适配器,通过...
  • 本发明涉及数据处理技术领域,公开一种基于流匹配的语音增强方法、装置、设备及介质,可应用于金融、医疗领域,该方法包括获取噪声语音数据并进行时频变换处理和标准化处理,得到标准化时频表示数据;基于标准化时频表示数据进行流匹配输入构建处理并输入至流...
  • 本发明涉及环境噪音监测与控制技术领域,公开了一种基于环境噪音的音频设备智能降噪方法与系统,所述方法包括获取实时原始音频信号,实现数据同步传输,得到实时噪音数据流;根据所述实时噪音数据流,进行音频信号频谱分析,得到频域分布特性;根据所述频域分...
  • 本发明涉及一种基于实时汽车引擎声生成的低延迟方法,属于汽车电子与数字信号处理技术领域。其中,该方法包括:通过高精度麦克风阵列实时采集汽车引擎的原始音频信号;边缘计算单元对采集的音频信号进行预处理并生成音效任务请求;通过声学特征提取模型和资源...
  • 本申请提供一种可渗透面对流矢量声比拟方法、装置及电子设备,应用于声学技术领域。包括:根据各声源时间以及可渗透面,确定对流矢量声比拟波动方程的声源项关键参数,声源项关键参数包括第一声源关键参数、第二声源关键参数和第三声源关键参数;根据对流中预...
  • 本发明涉及语言数据处理技术领域,且公开了一种针对多语种、复杂场景下的语言数据预处理方法,基于AutoPrep框架的多语种、复杂场景下的语音数据预处理系统,集成语音增强、语音分割、说话人聚类、目标语音提取与质量过滤五大模块,实现语音数据的自动...
  • 本申请涉及语音处理领域,公开了一种语音处理方法、介质、电子设备和程序产品,基于直线轨迹的ODE的扩散模型进行语音去噪处理,不会损伤语音数据,泛化性能较强,推理过程速度较快、计算效率较高。具体地,该方法在去噪推理过程中,可以通过扩散模型推理出...
  • 本申请涉及语音处理技术领域,公开了一种语音处理方法、介质、电子设备和程序产品。该方法先判断待处理的带噪语音数据所处的环境的嘈杂程度,例如可以获取待处理的带噪语音数据的信噪比等表征嘈杂程度的参数,然后基于表征嘈杂程度的参数设定不同的去噪推理次...
  • 本发明提供的一种车载收音机音频降噪的控制方法,通过获取车辆状态信息、区域特性信息和预设降噪模型;根据车辆状态信息,确定音频降噪响应模式;获取车载收音机音频质量信息,所述预设降噪模型根据所述音频降噪响应模式和所述区域特性信息对所述播放音频质量...
  • 本发明公开了一种音频数据的音色对象分离方法和装置,方法通过获取原始视频音频数据;若接收到字幕数据,则根据字幕数据的时间戳对原始视频音频数据进行裁剪,得到多段音频粗切片段;采用预设尺寸滑窗从每段音频粗切片段分别提取至少一段音频细切片段;从各段...
  • 本申请公开了一种音乐源分离方法及可穿戴设备,涉及信号处理技术领域,采用UNet架构的神经网络模型进行音乐源分离,神经网络模型至少包括编码器与解码器,方法包括:获取待分离音乐源的原始信号,将原始信号转换到频域得到频域信号;通过编码器对频域信号...
  • 本发明涉及对用于在场所内回放的复合音频节目进行解混和重混。系统、方法和装置能够回放与现实世界场所举办的活动相关联的复合音频节目。这些系统、方法和装置能够无缝地将复合音频节目解构为能够由现实世界场所共同回放的多个音频声音。作为这种解构的一部分...
  • 本申请涉及一种音频处理方法、系统、电子设备及存储介质。所述方法包括:当检测到音频信号发生变化时,获取当前信号幅度,并确定音频信号的补偿策略,所述补偿策略包括所述音频信号在多个声压级下的补偿子策略;根据所述信号幅度确定所述音频信号的预设声压级...
  • 本发明公开了一种基于图注意力网络的变压器声纹信号故障诊断方法,属于电力设备状态监测技术领域,包括以下步骤:S1、对变压器声纹信号按照时间顺序进行分割,形成多个时间序列样本;S2、对每个时间片段进行数据归一化处理,然后采用快速傅里叶变换将时域...
技术分类