Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于虚拟GPU的多语音合成模型承载方法及装置,涉及图形处理单元的技术领域,方法包括:通过对物理图形处理单元进行虚拟化处理,将其划分为多个具有独立显存与计算配额的虚拟处理单元,并结合资源调度机制,将语音合成语言模型实例部署于多个...
  • 本发明公开一种基于VITS模型改进的音频合成方法及存储介质,属于语音合成技术领域,方法包括:获取待合成音频数据的文本,对文本进行预处理;将预处理后的文本输入至预先训练的自适应语音合成模型AdaVITS进行音频合成;根据所述自适应语音合成模型...
  • 本发明提供一种语音合成方法、装置、电子设备及存储介质,涉及语音合成技术领域,该方法在语音合成过程中引入目标属性文本,可以支持具有目标属性文本对应的音频属性的语音合成,进而可以根据用户需求控制目标合成语音的表现力和韵律,使目标合成语音更加符合...
  • 本发明提出了一种基于人工智能的沉浸式传统文化语言音频特征提取方法,涉及特征提取技术领域,具体步骤包括:构建结构化的传统文化语言音频数据集,提取对数Mel频谱图与频率相位谱图;计算频率相位残差信息并构建牵引因子矩阵,进行归一化处理;基于谱主应...
  • 本发明公开了一种智能音频分析与语音识别云融合计算服务平台,包括如下模块:音频采集模块采集来自多终端设备的多通道音频数据;Gammatone滤波模块对音频数据进行滤波,提取初步音频特征;特征优化模块细化频谱信息,生成优化音频特征;状态检测模块...
  • 本发明公开了一种模型训练方法、语音识别方法、装置、设备及存储介质,其中模型训练方法包括:获取合成语音数据集和真实语音数据集并构建语音识别模型,模型包括编码器、适配模块和解码器;利用合成语音数据集对编码器和解码器进行预训练;冻结预训练后的解码...
  • 本发明公开了一种基于单声道人工智能模型的多声道通话录音识别方法,包括:输入多声道通话音频数据;针对每个声道进行语音活动检测,以获取每个声道中的语音片段以及检测时对应的原始时间戳;基于原始时间戳的先后顺序对原始时间戳进行排序,构建一条单声道音...
  • 本申请提供了一种语音指令执行方法、装置、车辆和存储介质,该方法应用于车辆领域,该方法包括:获取现实场景中目标声音信号对应的声源位置;获取位于声源位置的目标人员;基于声源位置与目标人员的记录位置的位置匹配关系,结合目标人员的历史指令文本和目标...
  • 本发明提供一种智能玩具的控制方法,该方法包括:在接收到用户的当前对话数据时,确定出当前对话数据是否为攻击性语言;若当前对话数据为攻击性语言,则控制智能玩具进入情绪对话模式,并将用户标记为攻击状态;在用户处于攻击状态下,基于当前对话数据以及情...
  • 本申请公开了一种设备的控制方法、存储介质及电子装置,涉及智能家居领域,该方法包括:在接收到目标对象的语音指令的情况下,调用预先训练的自然语言模型基于语音指令构造对应的自然语言表达式;根据自然语言表达式,确定目标对象的标识信息以及目标对象的控...
  • 本申请涉及智能语音交互技术,公开了一种升降桌的智能语音交互方法、装置、升降桌和存储介质,包括:当升降桌上电启动时,控制板进行系统初始化操作;升降桌基于麦克风接收到语音数据时,对语音数据进行预处理;调用预先设定的大模型将预处理后的语音数据转换...
  • 本申请提供了一种基于语音识别飞参软件人机交互方法、装置、设备及介质,属于航空电子技术领域,具体包括根据使用场景,对飞参软件进行分析,筛选出飞参软件中可用于语音识别与控制的功能区;根据飞参数据特性构建语音识别模型,将所述语音识别模型嵌入至所述...
  • 本申请实施例公开了一种语音唤醒方法、装置、终端及耳机,属于语音唤醒技术领域。所述方法包括:获取耳机发送的第一音频,所述第一音频由所述耳机通过第一麦克风采集,并在所述第一音频的第一唤醒词识别结果表征包含唤醒词时发送,所述唤醒词用于唤醒所述终端...
  • 本申请实施例公开了一种语音交互方法及装置、设备、存储介质,包括:获取车载终端采集的目标语音指令;根据预设提示词识别目标语音指令;在目标语音指令识别成功的情况下,输出与目标语音指令对应的车辆控制任务并执行车辆控制任务;在目标语音指令识别失败的...
  • 本发明公开的一种用于车辆的语音交互系统,包括:车载语音适配单元,用于接收用户输入的语音指令,并将语音指令转为文字指令;云端,通过语音适配单元接收文字指令,并采用预设大模型根据文字指令生成场景组合指令,场景组合指令被配置为控制车载应用和/或车...
  • 本发明涉及人工智能技术领域,应用于智慧医疗及金融场景,公开了一种外呼响应优化方法、装置、计算机设备及存储介质,包括:接收用户语音,采用自动语音识别方法对用户语音进行语音识别,获得语音识别文本;分别采用大语言模型、轻量级微响应预测模型和语义缓...
  • 本发明属于人工智能技术领域,具体的说是一种基于语音控制的家电智能唤醒系统及方法,该系统包括语音采集单元、超低功耗声学事件检测单元、自适应噪声鲁棒唤醒词识别单元、环境上下文感知单元及系统控制与电源管理单元。其中,超低功耗声学事件检测单元用于初...
  • 本发明公开了一种基于语音识别的继电保护智能自动化检测系统及方法,包括:硬件设备层、通讯接口层、自动测试层、语音控制层;硬件设备层:继电保护测试仪;通讯接口层:继电保护测试仪接口程序和规约引擎程序,电保护测试仪接口程序支持对继电保护仪的控制和...
  • 本申请适用于自然语言处理技术领域,尤其是一种录音摘要生成方法、装置、设备和介质。该方法包括:通过声纹特征提取模型将音频流转换为语音文本;将语音文本输入自然语言解析模型,获取语音文本对应的候选术语;将候选术语与知识图谱匹配,获取候选术语的术语...
  • 本申请公开了一种文本识别方法及其装置,属于语音处理领域。该方法包括获取第一语音,第一语音包括N个语音帧,N为正整数;获取每个语音帧对应的候选词组,每个候选词组中包含至少一个候选词,每个候选词对应一个方言语种;基于每个候选词组中的每个候选词所...
技术分类