Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种语音处理方法、电子设备及存储介质,涉及语音处理技术领域,方法包括:通过共享编码器对输入语音进行编码,得到声学特征序列,其中,共享编码器为基于Transformer结构的神经网络,且通过自监督学习方式训练得到;将声学特征序列输...
  • 本发明涉及新兴技术领域,涉及一种基于多模态用户兴趣向量计算的方言区域特征识别方法、系统及应用。包括构造种子用户兴趣特征矩阵:根据预设规则选取各方言区域的种子用户,提取其对平台内容的交互行为特征,形成种子用户兴趣特征矩阵;获取目标用户行为数据...
  • 本公开是关于一种通信方法、装置、电子设备及存储介质。通信方法包括:获取第一音频数据,确定第二音频数据,将第二音频数据传输至目标模块;其中,第一音频数据包括第一上行音频数据时,第二音频数据包括通过在线翻译或本地翻译方式基于第一上行音频数据翻译...
  • 本申请涉及人工智能技术领域,提供一种语音合成方法、系统、电子设备及介质,可应用于金融、医疗场景下的智能交互场景。方法部分包括:获取待合成的目标文本、目标说话人标识以及包含语气及风格信息的参考提示语音;对目标文本进行编码生成文本嵌入向量序列;...
  • 本申请提供一种基于双层风格建模的语音生成方法、装置、设备及介质,涉及语音合成技术领域。本申请方法将文本转换为音素序列并提取韵律标记序列,并采用门控融合机制将两者融合为音律音素融合特征,增强了语音的自然度和表现力。利用语义嵌入模型将文本风格描...
  • 本申请涉及语音合成技术领域,具体公开了一种基于因果音频编码的对话语音生成方法及装置。本申请通过对短帧音频进行流式传输和编码,无需等待用户语音的完整输入,降低了响应时间,避免了语音生成延迟,其次,将风格表示解耦为音色特征向量和韵律特征向量,克...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的韵律评估方法,包括:基于第一随机种子与第二随机种子,使用语音生成模型分别对获取的文本数据进行处理得到第一语音数据与第二语音数据;对第一语音数据与第二语音数据进行预处理得到第一目标语音与第二目...
  • 本申请提供一种多方言语音合成方法、装置、计算机设备及存储介质,涉及语音合成技术领域。本申请方法通过接收输入文本并识别其对应的语言类别,进而采用与语言类别相对应的映射规则将输入文本转换为标准化音素序列,确保了不同语言和方言的音素表示具有一致性...
  • 本申请属于语音生成技术领域,涉及基于推理引导的语音生成方法、装置、设备及存储介质,通过获取语音文本数据;读取初步设置的语音生成参数;输入到改进型语音生成模型中,通过改进型语音生成模型中的动态注意力推理引导机制和动态摇摆采样方式,实现了在不同...
  • 本申请公开了一种语音生成方法、装置、存储介质及电子设备,涉及语音处理技术领域,包括:获取目标场景中目标人物元素对应的待输出文本信息;基于目标场景对应的场景图像确定目标场景对应的语音输出特征;基于语音输出特征确定目标人物元素对应的语音输出方式...
  • 本公开提供了音频处理方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、计算机视觉、语音技术大模型等技术领域。具体实现方案为:获取视频应用的音频生成请求;视频应用处于音频模式,音频生成请求包括视频应用中处于播放状态的...
  • 本公开涉及用于调整合成人声音频的响度的方法、装置、设备和产品。该方法包括确定原始人声音频的第一响度曲线以及合成人声音频的第二响度曲线,其中原始人声音频为湿声音频,并且响度曲线指示声音的幅度随时间的变化情况。该方法还包括基于第一响度曲线,调整...
  • 本发明涉及语音合成技术领域中的基于自然语言提示的情感语音合成方法、系统及产品。情感语音合成方法包括:将自然语言提示输入训练好的提示‑情感映射器得到情感嵌入向量Eemo,将目标文本和Eemo输入训练好的情感语音合成模型生成带有自然语言提示中所...
  • 本申请实施例提供了一种基于语音对话的智能答复方法和装置、电子设备及介质,属于人工智能技术领域,适用于金融科技领域和医疗科技领域。该方法包括:接收目标对象的原始音频数据;对原始音频数据进行特征提取,得到原始音频特征数据;获取目标对象的历史沟通...
  • 本申请涉及语音合成技术领域,具体公开了一种基于双通道语义令牌和分块条件流匹配的语音生成方法。本申请通过双通道语义并行处理,生成第一语义令牌序列和第二语义令牌序列,两通道可以相互感知交互动态信息,能够准确获得说话人之间的交互信息,解决了单通道...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的语音转换方法,包括:对目标音频数据与源音频数据进行特征提取得到的第一梅尔频谱特征与第二梅尔频谱特征进行拼接得到第一拼接特征,并对得到的第一语义特征、第一基频特征、第一能量特征、第二语义特征、...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的语音处理方法,包括:对输入的多模态数据进行解析,得到语义嵌入向量,语音特征以及背景音特征;对语音特征与背景音特征进行融合得到联合特征;基于角色配置信息,使用目标大语音模型对联合特征与多语言文...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的语音处理方法,包括:对用户输入的原始语音进行特征提取得到语音特征;对语音特征进行矢量量化处理得到声学单元序列;基于情感感知编码器对原始语音进行处理得到情感嵌入序列;对声学单元序列与情感嵌入序...
  • 本公开的实施例提供一种用于语音合成的方法、装置、设备、存储介质和程序产品。该方法包括:获取与第一说话人的初始语音对应的语音编码表示,语音编码表示指示与说话人无关的语音特征,初始语音包括语音内容信息。基于语音编码表示和参考语音编码表示,利用预...
  • 本申请提供一种语音合成模型的优化方法、装置、计算机设备及存储介质,涉及语音合成技术领域。本申请方法将原始文本输入零样本语音合成模型生成第一语音,将原始文本和第一语音输入多层语音评估模型,对第一语音进行质量评估,精准识别了错误时段。基于语音评...
技术分类