Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于域泛化表征的跨域小样本类增量音频分类方法,步骤如下:从输入音频样本提取对数梅尔谱;初始化残差卷积神经网络,包括域泛化表征提取器和分类器;在基础环节,先后采用监督训练方法和显著性加权的对抗训练方法训练残差卷积神经网络;从基...
  • 本发明公开了一种基于时频特征融合的智能声音信号感知方法及系统,涉及智能声音信号处理技术领域,包括:获取原始音频信号;对所述原始音频信号进行短时傅里叶变换,获取复数频谱特征;将所述复数频谱特征输入至复数神经网络中进行处理,提取频域深度特征;采...
  • 本发明公开了基于轻量级卷积神经网络的多模态混叠声信号分离方法,涉及信号处理技术领域,通过对采集到的多模态混叠声信号进行预处理,以去除噪声并进行归一化处理。然后利用梅尔频谱图提取特征,将声信号转换为符合人耳听觉感知的频谱表示。接着通过构建的轻...
  • 本申请提供了一种语音分离方法,可以应用于音视频技术领域。该方法包括:获取多个发言对象的混合语音数据,确定每个发言对象的实际音高;将混合语音数据进行分离处理,得到每个发言对象的初始语音信号;对每个初始语音信号进行特征处理,得到每个发言对象的音...
  • 本发明涉及音频信号失真检测补偿领域,尤其涉及一种基于傅里叶变换的音频信号失真检测补偿处理方法,包括:利用实时音频信号数据建立音频信号数据的音频信号特征;根据所述音频信号数据的音频信号特征基于傅里叶变换进行转换处理得到音频信号变换结果;利用所...
  • 本发明公开了一种智能会议的语音数据降噪处理方法及系统,涉及语音处理技术领域,引入可编程门控并内置FGCNN加速引擎进行初始化,搭建FPGA板卡,建立会议平台与FPGA板卡的数据接口对接;根据数据接口,对基于会议平台的语音信号进行采集,导入F...
  • 本申请公开了一种降噪预处理方法和音频降噪方法及相关装置、设备,其中,降噪预处理方法包括:将目标场所中目标座位之外的其他座位作为候选座位;基于目标座位处音频输出设备播放的校准音频信号,获取目标座位处音频输入设备采集的第一音频信号和各个候选座位...
  • 本发明公开的一种特征语义区分和模型单步筛选的拟音音频生成方法,属于计算机音频合成与信号处理技术领域。本发明实现方法为:1、将音频样本通过提取梅尔谱特征,通过短时傅里叶变换形成音频的频域谱图,利用梅尔滤波器组对频域谱图进行频域映射和对数压缩,...
  • 本申请属于音频处理技术领域,涉及一种实时人声转呼麦的音频处理方法、装置及音频设备。方法包括:获取实时人声音频,进行维持单周期波形的八度降调,并去除声音的连续性,得到实时人声音频对应的喉音;获取实时人声音频,同时进行频谱分析、音高分析以及辅音...
  • 本发明涉及语音处理技术领域,可应用于金融科技和医疗健康领域,公开了一种基于条件流匹配的音频生成方法、装置、设备及介质,方法包括:获取原始音频信号,并对所述原始音频信号进行处理以生成语音Me l谱;对所述语音Me l谱进行编码得到低维压缩特征...
  • 本申请实施例公开了一种语音处理方法及装置。主要技术方案包括:接收语音指令,并将所述语音指令转换为语音文本;将所述语音文本和状态表信息并行输入语音处理模型和决策处理模型中,其中:利用所述语音处理模型生成第一回复文本,并将所述第一回复文本转换为...
  • 本申请公开了一种文本识别方法及其装置,属于语音处理领域。该方法包括获取第一语音,第一语音包括N个语音帧,N为正整数;获取每个语音帧对应的候选词组,每个候选词组中包含至少一个候选词,每个候选词对应一个方言语种;基于每个候选词组中的每个候选词所...
  • 本申请适用于自然语言处理技术领域,尤其是一种录音摘要生成方法、装置、设备和介质。该方法包括:通过声纹特征提取模型将音频流转换为语音文本;将语音文本输入自然语言解析模型,获取语音文本对应的候选术语;将候选术语与知识图谱匹配,获取候选术语的术语...
  • 本发明公开了一种基于语音识别的继电保护智能自动化检测系统及方法,包括:硬件设备层、通讯接口层、自动测试层、语音控制层;硬件设备层:继电保护测试仪;通讯接口层:继电保护测试仪接口程序和规约引擎程序,电保护测试仪接口程序支持对继电保护仪的控制和...
  • 本发明属于人工智能技术领域,具体的说是一种基于语音控制的家电智能唤醒系统及方法,该系统包括语音采集单元、超低功耗声学事件检测单元、自适应噪声鲁棒唤醒词识别单元、环境上下文感知单元及系统控制与电源管理单元。其中,超低功耗声学事件检测单元用于初...
  • 本发明涉及人工智能技术领域,应用于智慧医疗及金融场景,公开了一种外呼响应优化方法、装置、计算机设备及存储介质,包括:接收用户语音,采用自动语音识别方法对用户语音进行语音识别,获得语音识别文本;分别采用大语言模型、轻量级微响应预测模型和语义缓...
  • 本发明公开的一种用于车辆的语音交互系统,包括:车载语音适配单元,用于接收用户输入的语音指令,并将语音指令转为文字指令;云端,通过语音适配单元接收文字指令,并采用预设大模型根据文字指令生成场景组合指令,场景组合指令被配置为控制车载应用和/或车...
  • 本申请实施例公开了一种语音交互方法及装置、设备、存储介质,包括:获取车载终端采集的目标语音指令;根据预设提示词识别目标语音指令;在目标语音指令识别成功的情况下,输出与目标语音指令对应的车辆控制任务并执行车辆控制任务;在目标语音指令识别失败的...
  • 本申请实施例公开了一种语音唤醒方法、装置、终端及耳机,属于语音唤醒技术领域。所述方法包括:获取耳机发送的第一音频,所述第一音频由所述耳机通过第一麦克风采集,并在所述第一音频的第一唤醒词识别结果表征包含唤醒词时发送,所述唤醒词用于唤醒所述终端...
  • 本申请提供了一种基于语音识别飞参软件人机交互方法、装置、设备及介质,属于航空电子技术领域,具体包括根据使用场景,对飞参软件进行分析,筛选出飞参软件中可用于语音识别与控制的功能区;根据飞参数据特性构建语音识别模型,将所述语音识别模型嵌入至所述...
技术分类