Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种基于Web环境的音频响应曲线建模方法,包括以下步骤:S1:根据屏幕点击事件生成频率、增益,并由用户输入Q值,形成控制点;或获取由用户输入的频率、增益、Q值三个参数,形成控制点;S2:将控制点的频率、增益、Q值转换成高斯函数的参...
  • 本公开提出一种针对FunASR单声道音频的说话人分离方法、装置、设备和介质,该方法包括:将单声道音频输入至改造后FunASR模型中,以得到至少一个音频字符以及与每个音频字符对应的字符时间戳,其中,改造后FunASR模型中未配置标点预测模型和...
  • 本发明公开了一种用于现场交谈辅助的噪声消解方法和装置。该方法采集环境噪声和人声的混合声音信号,对所述混合声音信号进行特征提取和分析,利用神经网络模型识别出所述混合声音信号中的噪声成分和人声成分,提取所述人声成分以形成人声信号,并将所述人声信...
  • 本发明公开了一种开关柜振动信号降噪方法及装置,用于解决现有的开关柜振动信号降噪方法导致信号的可识别度低的技术问题。方法包括获取开关柜原始振动信号,并对开关柜原始振动信号进行预处理,输出归一化开关柜数字信号和归一化开关柜数字信号对应的信号频率...
  • 提供了方向性引起的鲁棒声学回声消除器适配。一种示例车辆音频系统包括被配置成生成音频的车辆扬声器、多个麦克风以及车辆控制模块,该车辆控制模块被配置成:经由多个麦克风接收输入信号,将输入信号分成平行域信号和正交域信号,为正交域滤波器权重选择恒定...
  • 本申请提出一种滤波器系数的确定方法、装置、电子设备和存储介质,其中,包括:获取目标时刻前的历史时刻多个子滤波器的滤波器系数,针对每一个子滤波器,根据基于历史时刻子滤波器的滤波器系数确定的约束信息,确定历史时刻子滤波器对输入的语音信号进行回声...
  • 本申请公开了一种设备唤醒方法和电子设备。其中设备唤醒方法具体包括:获取用户的多通道音频信息和所述用户的声纹特征信息;依据所述声纹特征信息,对所述多通道音频信息进行增强处理,得到所述用户的单通道音频信息;从所述单通道音频信息中,获取唤醒信息,...
  • 本申请公开了一种音频信号处理方法、装置、电子设备及存储介质。本发明实施例可应用于各种场景,包括但不限于云技术等。该方法包括:获取多个通话远端各自的音频信号;将目标通话远端的音频信号的能量值与各其他通话远端的音频信号的能量值相减,得到能量差值...
  • 本公开的实施例涉及用于音色转换的方法、装置、电子设备和产品。该方法包括确定待转换音频的语义特征,待转换音频具有原始音色。该方法还包括获取提示音频,提示音频具有不同于原始音色的目标音色。该方法还包括基于待转换音频的语义特征和提示音频,利用基于...
  • 本发明公开了一种基于多速率信号处理的音频采样率转换方法及相关装置,其中方法包括:将待转换的原始音频信号进行自适应多分辨率时频表示、感知加权因子生成和加权频谱重建,得到加权时频表示;根据Bark尺度对加权时频表示以及目标采样率进行频率子带划分...
  • 本发明提供了一种基于神经网络的轻量化流式语音编码系统和方法,所述系统包括编码压缩端与解码重建端;所述编码压缩端包含语音编码器与量化器;所述语音编码器包括时频变换模块、特征提取模块、编码端通道变换模块和长程时域相关性提取模块;所述特征提取模块...
  • 本公开涉及语音增强装置和方法。本申请揭露一种语音增强装置。该语音增强装置包括音频输入电路以及处理器。该音频输入电路配置以将音频输入信号转换成第一音频数据。该处理器配置以执行:根据该第一音频数据产生多个音频帧;对该等音频帧执行共振峰分析,以判...
  • 本发明提出了基于声纹识别的智能电销质量管控方法及系统,涉及电销质量管控技术领域。包括采用MFCC算法提取目标坐席语音数据的第一目标声纹特征,采用深度学习方法提取目标坐席语音数据的第二目标声纹特征;将第一目标声纹特征和第二目标声纹特征进行融合...
  • 本发明提供一种声纹注册方法及装置,所述方法包括:实时识别本次会话的语音数据;在识别本次会话的语音数据过程中,在声纹注册指令所指示的起点时刻,采集本次会话中目标说话人的语音数据;声纹注册指令是在目标说话人开始或正在说话时生成的;在采集的目标说...
  • 本发明涉及音频技术领域,尤其涉及一种音频特征生成方法、装置、设备及介质。音频特征生成方法包括:选择目标音视频;对目标音视频中的原始音频进行语音识别得到文本字符串,并输入语音生成工具中得到生成音频;对原始音频和生成音频进行特征提取得到原始音频...
  • 本申请提供一种煤矿班前会会议内容记录方法及装置,属于智能会议技术领域。其中的方法包括:采集会议过程中的语音数据;利用第一模型分离语音数据中的环境噪声和语音信号;利用第二模型识别语音信号,生成文字信息;由文字信息形成会议记录。第一模型利用卷积...
  • 本发明涉及人工智能、语音识别与智能终端控制技术领域,提供一种生成式AI驱动的语音点单与咖啡图案生成方法,包括基于触发预设的交互触发条件时,采集原始音频信号进行语音识别获取对应的文本信息进行语义解析,生成结构化语义结果,并根据结构化语义结果生...
  • 本申请提供了一种语音生成模型的训练方法、语音生成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取第一语音生成模型;获取多个模态的样本数据;基于提示语图像序列和语音文本分别调用多个编码器进行编码,得到多模态编码向量序列...
  • 本发明公开了支持多角色声纹识别的非接触式手术室智能语音控制方法,涉及语音交互控制技术领域,包括以下步骤:S100,采集手术室内所有高频手术设备在不同运行状态下的全频段噪声信号,提取谐波频率、幅度与相位特征,构建谐波噪声特征数据库,建立并动态...
  • 本发明涉及人工智能教育技术领域,具体为一种基于AI的家庭英语启蒙辅助系统,包括语音交互模块,用于通过麦克风阵列采集家长的中文语音指令和儿童的语音回应,并进行降噪处理后转换为结构化文本,其中儿童语音采用基于特定ChildMandarin数据集...
技术分类