Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音处理技术领域,可应用于金融科技和医疗健康领域,公开了一种播客音频生成方法、装置、设备及介质,方法包括:获取用户输入的与待生成的播客音频相关的播客信息;根据所述播客信息通过多代理系统生成对话脚本文本,其中,所述多代理系统包括对话...
  • 本发明关于一种语音合成模型的压缩方法、系统及设备,涉及人工智能领域。本技术方案解决传统模型部署难题,原始以ONNX格式存储占112MB,硬件需求高,嵌入式设备难承载,压缩后模型仅30MB,且推理提速,可在ARM芯片、低功耗MCU等边缘设备流...
  • 本发明公开了一种用于嵌入式终端的多段语音实时拼接与播放方法,旨在解决现有技术中硬件成本高、存储效率低、环境适应性差等问题。该方法包含客制化语音库生成、语音库智能更新、多段语音实时拼接播放等流程。在客制化语音库生成环节,通过采集嵌入式终端实际...
  • 本申请提供了一种基于人工智能的新闻播报方法及相关装置,所述方法包括:获取目标新闻对应的文字信息和图表信息;对文字信息和图表信息进行信息处理,得到目标播报文本及其对应的目标特征信息;对目标特征信息进行分析,得到参考内容属性和参考播报情感;根据...
  • 本申请提供一种AI语音交互方法和系统,从汽车主机厂的历史销售交互数据库中获取客户类型信息和客户购车偏好记录;利用预设的客户分类规则,生成客户类型标识符;对客户购车偏好记录进行解析,生成偏好特征向量,结合客户类型标识符和预设的汽车销售话术模板...
  • 本发明公开了一种多语种语音输入识别与切换方法,涉及语音识别切换技术领域,用于解决语种识别误差率增大的问题,通过多语言智能电话客服接收来电信息后,根据用户位置设定默认语种并发出指令信息,接收用户反馈语音并统计音色数量确定用户人数,形成用户群体...
  • 本申请提供了一种车载语音助手测试方法、装置及设备,应用于语音测试技术领域。该方法包括根据车辆的车辆信息,生成多种测试场景下的语音测试用例。基于语音测试用例,播放相应的测试语音。通过多种采集途径,获取车辆的车机系统针对测试语音的执行信息。分别...
  • 本申请涉及语音识别技术领域,公开一种音频处理方法,该方法应用于电子设备,在电子设备利用端到端模型执行说话人分类任务时,监测已输入至端到端模型中历史音频的数据量。在历史音频的数据量比较高的情况下,根据历史音频,筛选出数据量较小的核心样本来代表...
  • 本发明提供一种多模态动态优化的语音识别方法及其相关设备,包括:获取多模态输入数据,多模态输入数据包括声学数据以及本地信息数据;对声学数据以及本地信息数据进行特征提取与融合处理,确定特征融合数据;通过预设动态协同处理算法,对特征融合数据进行处...
  • 本申请公开了一种语音识别模型的训练方法、语音识别方法、装置、设备及介质,通过获取语音识别模型的编码器对语音序列样本处理后输出的编码向量序列,基于解码网络对编码向量序列进行解码处理,得到解码向量序列,基于解码网络对编码向量序列和解码向量序列进...
  • 本发明提出一种基于门控适配器的多阶段语音识别模型领域微调方法,旨在解决现有语音识别模型在使用领域数据进行微调时,易出现灾难性遗忘和在新领域上收敛缓慢的问题。该方法的核心是引入一种由适配器模块和门控模块组成的门控适配器,将领域知识的学习与应用...
  • 本发明公开了一种基于变分自编码器的座舱语义拒识方法及装置,该方法包括:获取指令文本、预设语义拒识模型和预设拒识阈值;预设语义拒识模型包括依次连接的编码器和解码器;预设语义拒识模型由变分自编码器搭建;将指令文本编码,得到第一隐藏向量;将第一隐...
  • 本发明实施例提供一种基于混合适配器的多语种语音识别方法。该方法包括:将语音输入至基于混合适配器的多语种语音识别模型,利用共享的语音编码器提取语音的音频特征;将音频特征输入至基于混合适配器的投影模块,投影模块包括:多个可训练的适配器以及路由器...
  • 本发明提供一种智能座舱人工智能生成内容的输入系统,其包括车端设备及云端设备,其中:车端设备,用于实时采集用户画像、环境、车辆工况数据,以及用户提问并上报至云端设备,并接收云端设备所反馈的答案;云端设备,用于收到来自车端的用户提问后,调用AI...
  • 本申请涉及人工智能技术领域,公开了一种适用于AI吉祥物的分体式智能交互盒子,包括:主板电池单元、发声器单元、独立麦克风单元以及屏蔽线缆,该盒子内部的核心计算模块通过主动声学标定,建立表征吉祥物宿主的专属声学指纹模型,并基于此对上行用户语音与...
  • 本申请提供了一种人工智能语音交互方法、系统、设备及存储介质,通过确定目标用户语音信号在不同时间尺度上的语音时域特征,进而构建目标用户的敏感频谱特征;对所述语音时域特征和所述敏感频谱特征进行特征拼接,得到所述语音信号的时频融合特征图;将所述时...
  • 本发明公开了一种基于人工智能的控制台语音交互方法,涉及计算机技术领域,本发明通过将异构API协议统一抽象为可计算拓扑结构,结合神经协议编译器的动态重组能力,消除公安视频平台树状校验与消防系统线性执行间的协议断层;深度优先参数填充与队列式传递...
  • 本公开涉及用于音频设备的多模式语音触发。本主题技术的具体实施提供用于音频设备的多模式语音触发的系统和方法。音频设备可存储多个语音识别模型,每个语音识别模型被训练用于检测单个对应的触发短语。为了音频设备可检测多个触发短语中的特定一者,而不消耗...
  • 本申请涉及涉及语音识别技术领域,公开了一种面向课堂教学的语音识别系统,包括:术语频谱建模模块,用于采集课堂教学中的专业术语语音数据,并通过短时傅里叶变换提取所述语音数据的频谱表示;稀疏字典构建模块,基于所述频谱表示训练术语的稀疏字典,所述字...
  • 本申请涉及数字人领域,具体涉及一种基于AI数字人的智能汽车管家系统。其采用基于深度学习的人工智能技术对用户输入的咨询语音进行语音识别和细粒度语义编码,从中提取出语音识别结果的上下文语义特征,同时结合用户输入的文本描述补充,通过对用户咨询的语...
技术分类