Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种车载语音助手测试方法、装置及设备,应用于语音测试技术领域。该方法包括根据车辆的车辆信息,生成多种测试场景下的语音测试用例。基于语音测试用例,播放相应的测试语音。通过多种采集途径,获取车辆的车机系统针对测试语音的执行信息。分别...
  • 本申请涉及语音识别技术领域,公开一种音频处理方法,该方法应用于电子设备,在电子设备利用端到端模型执行说话人分类任务时,监测已输入至端到端模型中历史音频的数据量。在历史音频的数据量比较高的情况下,根据历史音频,筛选出数据量较小的核心样本来代表...
  • 本发明提供一种多模态动态优化的语音识别方法及其相关设备,包括:获取多模态输入数据,多模态输入数据包括声学数据以及本地信息数据;对声学数据以及本地信息数据进行特征提取与融合处理,确定特征融合数据;通过预设动态协同处理算法,对特征融合数据进行处...
  • 本申请公开了一种语音识别模型的训练方法、语音识别方法、装置、设备及介质,通过获取语音识别模型的编码器对语音序列样本处理后输出的编码向量序列,基于解码网络对编码向量序列进行解码处理,得到解码向量序列,基于解码网络对编码向量序列和解码向量序列进...
  • 本发明提出一种基于门控适配器的多阶段语音识别模型领域微调方法,旨在解决现有语音识别模型在使用领域数据进行微调时,易出现灾难性遗忘和在新领域上收敛缓慢的问题。该方法的核心是引入一种由适配器模块和门控模块组成的门控适配器,将领域知识的学习与应用...
  • 本发明公开了一种基于变分自编码器的座舱语义拒识方法及装置,该方法包括:获取指令文本、预设语义拒识模型和预设拒识阈值;预设语义拒识模型包括依次连接的编码器和解码器;预设语义拒识模型由变分自编码器搭建;将指令文本编码,得到第一隐藏向量;将第一隐...
  • 本发明实施例提供一种基于混合适配器的多语种语音识别方法。该方法包括:将语音输入至基于混合适配器的多语种语音识别模型,利用共享的语音编码器提取语音的音频特征;将音频特征输入至基于混合适配器的投影模块,投影模块包括:多个可训练的适配器以及路由器...
  • 本发明提供一种智能座舱人工智能生成内容的输入系统,其包括车端设备及云端设备,其中:车端设备,用于实时采集用户画像、环境、车辆工况数据,以及用户提问并上报至云端设备,并接收云端设备所反馈的答案;云端设备,用于收到来自车端的用户提问后,调用AI...
  • 本申请涉及人工智能技术领域,公开了一种适用于AI吉祥物的分体式智能交互盒子,包括:主板电池单元、发声器单元、独立麦克风单元以及屏蔽线缆,该盒子内部的核心计算模块通过主动声学标定,建立表征吉祥物宿主的专属声学指纹模型,并基于此对上行用户语音与...
  • 本申请提供了一种人工智能语音交互方法、系统、设备及存储介质,通过确定目标用户语音信号在不同时间尺度上的语音时域特征,进而构建目标用户的敏感频谱特征;对所述语音时域特征和所述敏感频谱特征进行特征拼接,得到所述语音信号的时频融合特征图;将所述时...
  • 本发明公开了一种基于人工智能的控制台语音交互方法,涉及计算机技术领域,本发明通过将异构API协议统一抽象为可计算拓扑结构,结合神经协议编译器的动态重组能力,消除公安视频平台树状校验与消防系统线性执行间的协议断层;深度优先参数填充与队列式传递...
  • 本公开涉及用于音频设备的多模式语音触发。本主题技术的具体实施提供用于音频设备的多模式语音触发的系统和方法。音频设备可存储多个语音识别模型,每个语音识别模型被训练用于检测单个对应的触发短语。为了音频设备可检测多个触发短语中的特定一者,而不消耗...
  • 本申请涉及涉及语音识别技术领域,公开了一种面向课堂教学的语音识别系统,包括:术语频谱建模模块,用于采集课堂教学中的专业术语语音数据,并通过短时傅里叶变换提取所述语音数据的频谱表示;稀疏字典构建模块,基于所述频谱表示训练术语的稀疏字典,所述字...
  • 本申请涉及数字人领域,具体涉及一种基于AI数字人的智能汽车管家系统。其采用基于深度学习的人工智能技术对用户输入的咨询语音进行语音识别和细粒度语义编码,从中提取出语音识别结果的上下文语义特征,同时结合用户输入的文本描述补充,通过对用户咨询的语...
  • 本发明公开了一种语音助手交互方法以及系统,包括端侧设备层、云端服务层及通信交互层,所述端侧设备层包括至少两种终端设备,各终端设备配置多模态传感器。本发明通过多模态数据融合补偿单模态噪声干扰,显著优于现有语音助手;基于意图、情绪和设备的三元组...
  • 本发明涉及语音识别技术领域,尤其涉及一种智能门窗多智能控制切换方法及系统,方法包括:获取混合声音信号和模板声音信号,对混合声音信号进行分解和切分,得到多个源信号及源信号帧,在各源信号帧中,确定各频率作为目标频率时的谐波集合和次谐波集合,计算...
  • 本发明公开了一种人形机器人全身协同语音控制系统及方法,涉及机器人技术领域,针对现有人形机器人语音控制中存在语义理解浅层化、动作规划局部化及安全控制滞后化的问题,本发明通过多模态意图理解模块、全身动作规划模块、动态平衡安全仲裁器和微内核安全调...
  • 本发明提供一种语音交互方法、装置及电子设备,涉及语音处理技术领域,其中方法包括:获取用户输入的语音信息,并获取用户的历史意图文本;将所述语音信息输入至口语理解模型的语音编码器,得到所述语音编码器输出的声学编码特征;将所述历史意图文本输入至所...
  • 本发明公开了一种基于边缘智能的多语言拟人语音转述社交装置及其异步交互方法,适用于儿童、老年人、情侣等用户群体的跨语言情感交流。所述装置包括语音采集模块、边缘智能识别模块、通信模块和拟人语音输出模块,支持本地语音识别与确认后上传。云端平台完成...
  • 本发明涉及智能外呼技术领域,一种基于语音识别与语言理解的智能外呼交互方法及系统,包括:基于任务分配指令获取目标外呼任务及话术模版集,确认利用目标号码获取用户的初始语音信号后,对初始语音信号进行降噪及特征提取得到降噪语音信号特征集,利用自动语...
技术分类