Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音检测技术领域,并提供了基于TinyML的端侧深度合成语音检测方法,包括如下步骤:S100、接收原始音频信号,通过汉明窗进行分帧处理,帧长为20ms,帧移为10ms;S200、提取复合声学特征集,包括:传统声学特征,深度伪造敏感...
  • 本发明公开了一种基于声音相似度的开关柜状态检测方法,包括:通过移动检测设备搭载音频采集装置,按预设路径采集电力设备运行音频数据;对音频数据依次执行归一化处理、滤波处理及滤波标准化处理;采用加窗处理减少频谱泄漏,通过特征增强处理提取有效特征并...
  • 本发明提供的基于掩码重建与时频特征融合的伪造音频检测系统和方法,所述伪造音频检测系统,包括:数据准备模块、频谱特征提取模块、时频特征融合及预测模块、训练模块、以及伪造音频检测模块,通过获取待检测音频的对数梅尔频谱图,通过音频掩码自编码器的双...
  • 本发明公开了一种实时语音基频轮廓提取方法及系统,包括:对接收到的一帧声信号进行预处理,预处理后的信号包括若干个采样点,每个采样点具有对应的幅值;对预处理信号进行局部极值侦测后,获得极大值点集和极小值点集;根据极大值点集和极小值点集,以及第一...
  • 本发明涉及金融、医疗健康及人工智能技术领域,提供一种TTS语音与3D嘴型同步生成方法、装置、设备及介质,利用小样本自适应训练引擎,基于迁移学习框架训练得到TTS语音与3D嘴型的同步生成模型,提高了模型的泛化能力及训练效率;利用多模态联合编码...
  • 本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于多模态语义对齐的决策方法、装置、设备及介质,包括:获取语音、视觉、动作数据并提取各自特征,构建语音、视觉、动作语义图谱,以语音语义图谱为基准执行跨模态对齐生成...
  • 本发明涉及智能音频识别技术领域,公开了耳夹式蓝牙耳机的AI环境声识别系统。该系统包括声音采集模块、声音分区模块、特征映射模块、模型组合模块、数据库更新模块和识别管理模块。声音采集模块捕获环境声音信号并转换为数字音频数据流;声音分区模块预处理...
  • 本发明提供了一种基于多模态融合的耳鸣患者智能社交辅助系统及方法,涉及医疗辅助技术领域,包括:采集环境声音信号、语音信号以及图像数据,并进行初步处理;制定个性化自适应降噪算法以及语音增强算法,进而获得增强语音信号;构建唇语识别模型,对增强语音...
  • 本申请公开了一种音频处理方法、装置、存储介质、电子设备及车辆,涉及车辆技术领域。方法包括:获取待处理音频信号;将待处理音频信号进行快速傅里叶变换,得到频域数据;按预设淡入淡出函数对频域数据进行平滑处理;对经过平滑处理后的频域数据进行快速傅里...
  • 本发明公开了一种基于子空间滤波的语音降噪方法、系统、介质及设备,属于软件工程与通信技术领域,所述方法为:对带噪语音进行分帧处理;提取各帧的自相关系数和梅尔倒谱系数,拼接组成特征向量并输入噪声估计网络,预测得到各帧的噪声自相关系数;根据各帧的...
  • 本发明实施例公开了磁共振成像中的语音增强方法、装置及磁共振成像系统。方法包括:实时采集MR扫描室内的时域声音信号;将时域声音信号转换到频域,得到频域声音信号;将频域声音信号输入到过滤带宽与人耳听觉的过滤带宽等同的带通滤波器,将带通滤波后的频...
  • 本申请实施例应用于人工智能领域,提供了一种音频处理方法、声音分离模型训练方法及电子设备,该方法包括:对麦克风阵列中M个麦克风分别采集得到的M个采集音频进行融合,得到融合音频,M为大于1的整数;利用声音分离模型对融合音频进行多次去噪处理,以得...
  • 本申请实施例应用于人工智能领域,提供了一种音频处理方法、去噪模型训练方法及电子设备,该方法包括:利用去噪模型对所述待处理音频进行多次用于去除高斯噪声的去噪处理,以得到去噪音频,所述去噪音频表示的声音为所述语音,所述去噪模型进行第一次所述去噪...
  • 本发明一种基于三域注意循环网络的海上无线通信语音增强方法,属于语音增强技术领域,包括以下步骤:获取单通道海上无线通信音频信号;对单通道海上无线通信音频信号进行预处理;构建三域注意循环网络,用于实现海上无线通信语音的增强;对三域注意循环网络进...
  • 本申请提供了一种音频通信方法、音频转换方法、装置、设备、存储介质及程序产品;涉及人工智能技术;方法包括:响应于针对音频信号的通信请求,从多个通信模式中获取针对音频信号的变声模式;对音频信号进行特征编码处理,得到音频信号的编码特征;获取变声模...
  • 本申请提出了一种处理方法、设备及存储介质,方法应用于智能终端,包括以下步骤:获取目标音色和/或目标音频的应用场景的音色参考信息;基于目标音色和/或音色参考信息,对目标音频进行处理。本申请的技术方案, 可以对音频的音色进行处理和/或音色处理效...
  • 本发明涉及耳机降噪技术领域,具体涉及基于深度卷积神经网络的低延时蓝牙耳机音频重采样方法,步骤1, 建立一种端到端的多任务深度学习耳机降噪模型;步骤2, 选择音频样本;步骤3, 采用步骤2中得到的音频样本对待训练的多任务深度学习降噪模型进行训...
  • 本申请公开了一种宽带与窄带集群通信系统互通媒体面处理方法和设备,宽带集群终端与宽带集群系统通信,宽带集群系统与窄带集群系统通信,窄带集群系统与窄带集群终端通信,均使用NVOC语音编码方式;如果宽带集群系统在呼叫建立过程中指示了语音编码速率则...
  • 本申请公开了一种语音数据处理方法、装置、存储介质及电子设备,其中,本申请通过采集待处理的用户语音数据,通过语音数据处理模型基于用户语音数据对语音识别任务和命名实体识别任务进行任务共享编码处理得到语音编码特征,基于语音编码特征进行语音识别处理...
  • 本申请涉及信号处理技术领域,特别涉及一种针对编码器的比特池优化的比特分配方法、装置及设备,其中,方法包括:获取编码器输入音频的基本信息;根据基本信息确定编码器的当前编码模式;若当前编码模式为恒定比特编码模式,根据基本信息中的帧总数循环执行恒...
技术分类