Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开的实施例提出语音指令词识别方法和装置。方法包括:将待识别的音频输入第一编码器进行特征编码,得到音频编码特征;将音频编码特征输入语音判别器进行语音判别,得到语音判别结果;若语音判别结果指示音频为语音,则将音频编码特征分别与预先保存的一语...
  • 本发明涉及语音交互技术领域,公开了一种语音交互模型的优化方法、装置、设备及介质,包括:接收来自多个终端设备的隐私增强参数集合;其中,隐私增强参数集合中的参数,由终端设备对语音交互模型中的模型参数依次进行筛选与隐私保护处理得到;对隐私增强参数...
  • 本公开提供了语音交互方法、模型训练方法、装置及电子设备,涉及计算机技术领域,尤其涉及人工智能、自然语言、大模型、深度学习等技术领域,应用于智能体、智能电商、数字人等场景中。具体实现方案为:响应于在当前对话中用户的第一语音信号,对第一语音信号...
  • 本申请公开了一种唤醒方法、装置、设备、介质及产品,方法包括:响应于目标用户针对唤醒词的触发操作,从音频库中获取与唤醒词匹配的目标音频片段;对目标音频片段进行拼接,生成具有目标用户声学特征的训练音频;由加噪音频和训练音频构成训练集;利用训练集...
  • 本发明公开一种基于情绪感知的音响控制方法、装置、终端设备及存储介质,所述方法包括:将所述第一偏移量、所述第二偏移量、第三偏移量、所述韵律特征向量、所述谱特征向量和所述音质特征向量输入预置的情感分类模型,得到所述语音信号的情绪类别及置信度;若...
  • 本发明涉及语音处理技术领域,具体公开了基于智能语音的PTE口语问答评测方法及系统,获取原始语音信号,提取声学特征序列;通过相空间重构与递归率矩阵计算瞬时语速,超阈值时生成时长规整因子;依据该因子确定分数阶傅里叶变换阶次,计算瞬时频率偏差加权...
  • 本发明涉及人工智能与教育技术交叉领域,具体公开了一种基于深度学习的体育口令学习与评测方法及系统。所述方法通过构建细粒度标注的体育口令专用语音数据集,采用基于Transformer架构的深度学习模型,对输入的音频进行梅尔频率倒谱系数特征提取与...
  • 本发明公开了一种基于声学锚点的方言语音识别方法及装置,其中,该方法包括:构建混合词表;根据混合词表对方言音频进行文字标注,以得到方言种子库;获取普通话语料库,并对普通话语料库中的普通话音频和方言种子库中的方言音频进行特征提取和拼接,以得到人...
  • 本申请公开了一种语音翻译方法、电子设备、存储介质及计算机程序产品,涉及信号处理技术领域,包括:对实时获取到的语音特征序列按所述语音特征序列中的语义边界进行实时切分,得到当前语义块;并行翻译所述当前语义块中的各语法单元,得到所述当前语义块的语...
  • 本申请公开了一种语音处理方法、装置、电子设备及存储介质,涉及语音处理技术领域,方法包括:通过语音编码器从输入语音中提取语言无关中间表示,其中,语音编码器为基于Transformer结构的神经网络,且基于云端模型进行知识蒸馏得到;基于运行上下...
  • 本申请公开了一种语音处理方法、电子设备及存储介质,涉及语音处理技术领域,方法包括:通过共享编码器对输入语音进行编码,得到声学特征序列,其中,共享编码器为基于Transformer结构的神经网络,且通过自监督学习方式训练得到;将声学特征序列输...
  • 本发明涉及新兴技术领域,涉及一种基于多模态用户兴趣向量计算的方言区域特征识别方法、系统及应用。包括构造种子用户兴趣特征矩阵:根据预设规则选取各方言区域的种子用户,提取其对平台内容的交互行为特征,形成种子用户兴趣特征矩阵;获取目标用户行为数据...
  • 本公开是关于一种通信方法、装置、电子设备及存储介质。通信方法包括:获取第一音频数据,确定第二音频数据,将第二音频数据传输至目标模块;其中,第一音频数据包括第一上行音频数据时,第二音频数据包括通过在线翻译或本地翻译方式基于第一上行音频数据翻译...
  • 本申请涉及人工智能技术领域,提供一种语音合成方法、系统、电子设备及介质,可应用于金融、医疗场景下的智能交互场景。方法部分包括:获取待合成的目标文本、目标说话人标识以及包含语气及风格信息的参考提示语音;对目标文本进行编码生成文本嵌入向量序列;...
  • 本申请提供一种基于双层风格建模的语音生成方法、装置、设备及介质,涉及语音合成技术领域。本申请方法将文本转换为音素序列并提取韵律标记序列,并采用门控融合机制将两者融合为音律音素融合特征,增强了语音的自然度和表现力。利用语义嵌入模型将文本风格描...
  • 本申请涉及语音合成技术领域,具体公开了一种基于因果音频编码的对话语音生成方法及装置。本申请通过对短帧音频进行流式传输和编码,无需等待用户语音的完整输入,降低了响应时间,避免了语音生成延迟,其次,将风格表示解耦为音色特征向量和韵律特征向量,克...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的韵律评估方法,包括:基于第一随机种子与第二随机种子,使用语音生成模型分别对获取的文本数据进行处理得到第一语音数据与第二语音数据;对第一语音数据与第二语音数据进行预处理得到第一目标语音与第二目...
  • 本申请提供一种多方言语音合成方法、装置、计算机设备及存储介质,涉及语音合成技术领域。本申请方法通过接收输入文本并识别其对应的语言类别,进而采用与语言类别相对应的映射规则将输入文本转换为标准化音素序列,确保了不同语言和方言的音素表示具有一致性...
  • 本申请属于语音生成技术领域,涉及基于推理引导的语音生成方法、装置、设备及存储介质,通过获取语音文本数据;读取初步设置的语音生成参数;输入到改进型语音生成模型中,通过改进型语音生成模型中的动态注意力推理引导机制和动态摇摆采样方式,实现了在不同...
  • 本申请公开了一种语音生成方法、装置、存储介质及电子设备,涉及语音处理技术领域,包括:获取目标场景中目标人物元素对应的待输出文本信息;基于目标场景对应的场景图像确定目标场景对应的语音输出特征;基于语音输出特征确定目标人物元素对应的语音输出方式...
技术分类