Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种语音合成系统的方法及终端,该方法包括步骤:预先获取待处理的听力文本,并利用第一模型对所述听力文本进行考点标注,得到第一听力文本;利用第二模型对所述第一听力文本进行语音标注,得到第二听力文本,并利用所述第二模型对所述第二听力文...
  • 本公开提供了用于语音处理的方法、装置、设备、存储介质和程序产品。该方法包括:获取针对目标用户的问题语音的应答文本;至少基于应答文本的语音转换要求,选择本地的第一语音合成模型和服务端处的第二语音合成模型中的至少一个语音合成模型,用于对应答文本...
  • 本申请公开了一种模型训练方法、动作确定方法、装置、设备、介质、产品,该方法包括:先获取样本音频序列、样本音频序列对应的标签动作序列、以及样本音频序列的文本;再依据该文本以及至少一个维度的调整约束,生成第一音频序列,以使第一音频序列的文本与样...
  • 本申请公开了一种基于对抗训练的风格语音合成方法、装置及电子设备,该方法包括:获取目标文本数据和目标说话人的目标参考语音数据;将目标文本数据和目标参考语音数据输入至预先训练的语音合成模型中,输出目标说话人对应的目标合成语音数据,预先训练的语音...
  • 本发明涉及语音信号处理领域,具体涉及多通道空间混合音频数据集的生成方法。针对传统的加性混合声音数据集缺乏空间位置信息,难以应对复杂场景,限制了语音处理任务的效果的问题,本发明提供了一种生成多通道空间混合音频数据集的方法,通过模拟声源在空间中...
  • 本公开提供了一种语音合成方法、装置、计算机可读存储介质及电子设备,该方法包括:获取语音合成指示信息;基于语音合成指示信息,生成音色指示文本和待合成文本;从音色数据库中,提取与音色指示文本匹配的目标音色编码;利用预先训练的语音合成模型,对目标...
  • 本发明公开了一种语音数据生成方法、装置、设备及介质。方法包括:获取第一用户处于闭嘴状态下第一喉振传感器所采集的第一初始喉振信号,以及第二喉振传感器所采集的第二初始喉振信号,以及第一喉振传感器的第一运行状态和第二喉振传感器的第二运行状态;计算...
  • 本申请实施例提供了一种语音情感识别方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和医疗科技领域。该方法包括:获取样本音频数据;对样本音频数据进行特征提取,得到样本情感特征;基于样本情感特征生成样本合成文本;样本合成...
  • 本发明涉及语音语义技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于伪自回归建模的语音生成方法、装置、设备及介质,包括:获取包含文本序列、提示语音片段和目标语义令牌序列的训练样本;对文本到语义模型执行连续片段掩码训练以获得经伪...
  • 本发明涉及自动化设备语音提示技术领域,具体提供一种自动化设备的语音提示控制方法及自动化设备,旨在解决现有自动化设备的语音提示内容固定不变,无法根据实际运行状态针对地进行提示的问题。为此目的,本发明的控制方法包括:S1,获取自动化设备的实际运...
  • 本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和医疗科技领域。该方法包括:获取语音合成数据集;其中,语音合成数据集包括语音合成样本和情感指示标签;对情感指示标签进行令牌转换,得到情感标...
  • 本申请实施例提供了一种多语言语音合成方法和装置、电子设备及存储介质,属于人工智能技术领域,应用于金融场景和医疗场景。该方法包括:通过原始语音合成模型对训练原始人声信息进行音色偏移处理,根据训练文本语言和融合音色偏移特征和目标人声特征所得的训...
  • 本申请提出的语音合成方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:获取目标情感文本,对目标情感文本进行文本编码,得到目标情感向量;获取说话人语音,对说话人语音进行说话人编码,得到目标说话人属性向...
  • 本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和医疗科技领域。该方法包括:获取语音合成文本和合成情感提示;其中,合成情感提示具有目标提示情感类别;对语音合成文本与合成情感提示的目标提示...
  • 本申请涉及语音合成技术领域,具体公开了一种基于语义对齐变分自编码器的语音合成方法及装置。本申请通过预先训练的语义对齐变分自编码器进行潜在特征提取,能够获得语义对齐的音频特征,不仅包含了说话人参考音频中的声学信息,还保留了说话人参考音频中的语...
  • 本发明公开了一种提升大模型语音合成多样性的提示词自动匹配方法及系统,属于人工智能领域。方法包括将原始长文本划分为多个文本块;通过最小编辑距离和语义相似度计算得到文本块与每个候选提示词的综合相似度得分后,引入情感平滑机制计算得到文本块与每个候...
  • 本发明涉及人工智能技术领域,应用于智慧医疗和金融领域,公开一种语音合成模型训练方法、装置、设备及介质,方法包括:获取包括目标文本序列、与目标文本序列对应的目标干净语音和带噪提示音频的训练样本;根据带噪提示音频,通过预训练的语音模型提取声学先...
  • 本发明提供一种语音合成方法、装置、电子设备及存储介质,该方法包括:将目标输入信息输入至语音合成模型的分布预测模型,得到目标声学特征对应的预测分布参数;所述目标输入信息包括待合成的语音属性信息和待合成的语音内容信息;根据所述预测分布参数,获取...
  • 本发明涉及语音提醒技术领域,具体为一种AI语音医嘱穿戴设备的提醒方法及系统,包括以下步骤,基于身份字段提取医嘱文本,分析行为关键词组合,生成执行特征集合,判断执行频率和注意事项字段提取等级参数,生成响应等级区间,匹配语音身份模型筛选播报特征...
  • 本申请公开了一种音频处理方法、装置及系统,所述方法包括:基于训练音频数据,训练解码器学习至少一个目标音色;提取待转换音频的第一声学特征,结合第一目标音色标签,将所述第一声学特征转化为带有第一目标音色的目标音频;输出所述目标音频。
技术分类