Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及智能语音交互技术领域,具体为一种用于软件的集成语音识别技术的智能交互系统,包括:语音处理模块、特征提取模块、语音识别模块、结果优化模块、语义解析模块和交互执行模块。该系统接收原始语音信号,经预处理和特征提取后,由语音识别模块生成多...
  • 本发明公开了一种用户语音状态判断及处理方法、系统和电子设备。该方法包括:采集用户方音频数据;判断用户是否处于发言状态;将用户方音频数据转换为文本数据;对文本数据实现完成/未完成/等待三分类后分别进行处理,突破传统二分类局限,区分真实结束发言...
  • 本发明公开了一种基于声纹白名单的端侧预筛选与端云协同校验的语音生成方法、系统、设备、介质及程序产品,涉及声纹识别与音频流控制技术领域。该方法包括:通过录音设备端,对输入音频进行语音活动检测,得到候选语音段;根据各第一声纹模板,对候选语音段进...
  • 本发明公开了一种基于个性化声纹训练的自适应鼾声抵消方法、装置及病友专用睡眠耳塞,属于智能降噪与睡眠辅助技术领域,旨在解决病房内打鼾干扰病友睡眠的问题。本发明包括个性化训练和实时识别抵消两阶段,训练阶段采集病房打鼾病友鼾声音频,提取声学特征经...
  • 一种基于物理引导网络的毫米波雷达语音重建与识别方法,包括:使用毫米波雷达对待测目标发射射频信号并接收回波信号,同时采集参考音频信号;根据回波信号提取稳相信号梅尔谱;通过对参考音频信号和公共语音数据集进行音频信号模拟生成模拟雷达梅尔谱;对稳相...
  • 本申请实施例提供了一种音频对象分类方法和装置、电子设备及存储介质,属于语音处理技术领域。该方法包括:获取第一说话对象的第一数量的第一对象音频,并获取第二说话对象的第二数量的第二对象音频;基于音频对象确认模型的特征提取子模型对第一数量的第一对...
  • 本发明公开了一种基于多层级语音表征的跨场景伪造语音检测方法。该方法从待测语音源获取语音样本,并将其输入经端到端联合训练的伪造语音检测模型进行检测,所述模型包括自监督学习语音表征模块、层级时间注意力网络和轻量化分类器。自监督学习语音表征模块用...
  • 本发明公开基于多尺度跨分支特征交互的伪造语音检测方法及装置,属于伪造语音检测技术领域;方法包括:获取并预处理训练语料,得到固定时长的语音片段;构建检测模型,将语音片段输入检测模型中进行训练;所述检测模型包括:前端特征提取模块、多尺度跨分支特...
  • 本发明涉及人工智能技术领域,公开了一种基于智能眼镜的会议记录方法,该方法包括:采集会议环境的初始音频数据,对目标音频数据进行成分分析确定若干个独立声源音频,基于唇部像素点和唇语模型确定人员唇语,并将人员唇语和每一独立声源音频进行对比,将会议...
  • 本申请涉及一种语音编码数据的处理方法、装置、设备和芯片。该方法包括:对语音编码数据进行预解码处理,并确定预解码后的伪装帧;将语音编码数据中对应伪装帧的帧头信息调整为第一帧头信息,第一帧头信息用于指示相应帧异常;其中,调整后的语音编码数据用于...
  • 本申请是关于一种音频识别方法、装置、计算机设备、存储介质及程序产品,涉及音频识别技术领域。该方法由计算机设备执行,方法包括:获取音频文件的音频识别信息,音频识别信息是音频文件中的目标频段转化后得到的信息,目标频段包括超声波频段以及次声波频段...
  • 本说明书实施例提供一种音频处理方法、系统、计算设备及存储介质,其中音频处理方法包括:获取多种类型的初始音频以及参考音频特征;基于初始音频的初始音频特征,确定各类型的初始音频之间的音频特征关系;以听觉频响关系为约束,基于参考音频特征和音频特征...
  • 本发明公开一种基于位置提示的多声源双耳音频合成方法,涉及音频处理技术领域,解决现有技术无法直接从未经处理的多声源混合单声道信号中生成高质量双耳音频的技术问题;本发明包括给定用于指定目标声源的期望空间位置的位置提示p,将单声道输入信号建模为语...
  • 本发明涉及语音处理技术领域,尤其为一种智能语音处理方法,包括以下步骤:S1,先接收周围环境声音,得到环境噪声,对环境噪声进行去除DC偏置,并在环境噪声中减去直流分量,将去除DC偏置后的环境噪声进行缩放,缩放后,使用I CA算法对缩放噪声信号...
  • 本发明公开了一种基于双流网络的语音增强方法、系统、设备和介质,包括以下步骤:步骤S1,建立用于双流网络的双通道语音数据集;步骤S2,构建用于双通道语音增强的双流网络模型;步骤S3,训练双流网络模型,建立带噪语音和纯净语音、语音端点信息的映射...
  • 本发明公开了一种一维小波与时间‑通道感知Mamba的语音增强方法、系统,涉及语音增强技术领域,包括:输入原始带噪语音并预处理,获得一维信号;将一维信号输入多层一维卷积,提取局部时域特征;对局部时域特征沿时间维度应用小波变换,并对生成的子带进...
  • 本发明涉及音频信号处理技术领域,特别是一种自适应动态音频处理方法、存储介质和终端。自适应动态音频处理方法包括:获取参考信号与麦克风阵列各麦克风信号,对二者分帧得到参考信号帧与麦克风信号帧;计算各帧信号能量,将参考信号能量、麦克风信号能量分别...
  • 本发明提供一种语音处理方法及系统,所述系统包括由多个语音处理模块构成的初始语音处理链路,所述包括:获取待处理的音频信号,并基于所述音频信号提取用于表征当前声学场景的多模态特征信息;基于所述多模态特征信息确定对应于所述当前声学场景的声学处理模...
  • 本发明公开了一种基于全神经波束形成器的多通道增强方法,包括如下步骤:对输入的多通道带噪语音信号执行短时傅里叶变换,将时域信号分解为频域的幅度谱和相位;以多通道带噪语音信号的幅度谱为输入,通过基于位置感知循环卷积的全神经波束形成器模型将其映射...
  • 本发明提供一种自适应噪声消除方法、装置、设备及存储介质,通过获取待处理的含噪音频信号,并将所述含噪音频信号转换为含噪时频表征;将所述时频域表征输入至噪声消除模型进行处理,以生成去噪时频表征;再将所述去噪时频表征进行逆变换,得到去噪后的目标音...
技术分类