Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种提升大模型语音合成多样性的提示词自动匹配方法及系统,属于人工智能领域。方法包括将原始长文本划分为多个文本块;通过最小编辑距离和语义相似度计算得到文本块与每个候选提示词的综合相似度得分后,引入情感平滑机制计算得到文本块与每个候...
  • 本发明涉及人工智能技术领域,应用于智慧医疗和金融领域,公开一种语音合成模型训练方法、装置、设备及介质,方法包括:获取包括目标文本序列、与目标文本序列对应的目标干净语音和带噪提示音频的训练样本;根据带噪提示音频,通过预训练的语音模型提取声学先...
  • 本发明提供一种语音合成方法、装置、电子设备及存储介质,该方法包括:将目标输入信息输入至语音合成模型的分布预测模型,得到目标声学特征对应的预测分布参数;所述目标输入信息包括待合成的语音属性信息和待合成的语音内容信息;根据所述预测分布参数,获取...
  • 本发明涉及语音提醒技术领域,具体为一种AI语音医嘱穿戴设备的提醒方法及系统,包括以下步骤,基于身份字段提取医嘱文本,分析行为关键词组合,生成执行特征集合,判断执行频率和注意事项字段提取等级参数,生成响应等级区间,匹配语音身份模型筛选播报特征...
  • 本申请公开了一种音频处理方法、装置及系统,所述方法包括:基于训练音频数据,训练解码器学习至少一个目标音色;提取待转换音频的第一声学特征,结合第一目标音色标签,将所述第一声学特征转化为带有第一目标音色的目标音频;输出所述目标音频。
  • 本发明公开了一种基于长文本建模的个性化语音生成方法,属于语音合成技术领域。该方法先获取原始训练文本和音频形成原始数据集,进行预处理后得到标准化拼音序列;然后对改进注意力机制的TacotronV2模型进行批量训练,得到预训练模型Checkpo...
  • 提供用于具有语音克隆和虚拟形象的剪辑生成系统和方法。一种方法包括访问模板视频和接收输入文本,以及基于模板音频数据和输入文本生成克隆音频数据。该方法还包括从模板视频的连续视频帧中提取参考图像,并将克隆音频数据、参考图像和连续帧提供给视频生成模...
  • 本发明涉及人工智能技术领域,公开了一种粤剧语音智能克隆及推荐方法,该方法包括:首先获取语音合成文本、用户与大语言模型的交互内容及用户上传语音;将语音合成文本输入预先训练的模型生成具有粤剧特色的语音;基于用户交互内容通过角色匹配确定系统提示词...
  • 本申请涉及语音合成技术领域,具体公开了一种基于副语言的语音合成方法、装置、计算机设备及介质。本申请通过韵律预测获得韵律特征,有效融合文本与参考声学信息,根据副语言标签序列获得副语言特征,进而协同利用文本特征、预测韵律特征与副语言特征合成目标...
  • 公开了一种语音交互方法、语音识别模型的训练方法及电子设备。所述语音交互方法包括:获取源语言对应的语音数据;基于预先训练的语音识别模型,对所述语音数据进行语音处理,获得所述源语言对应的语音识别数据和目标语言对应的语音翻译数据;显示所述语音识别...
  • 本发明提供一种多语种自动语音识别方法、系统、存储介质及电子设备,包括获取多个语种的字表的字表特征向量;获取语种标识符特征和识别标识符特征;获取待识别语音的声学特征矩阵;基于语种标识符特征、声学特征矩阵和识别标识符特征获取输出特征矩阵;基于所...
  • 本申请实施例提供了一种基于人工智能的语音生成方法和装置、设备、存储介质,属于人工智能技术领域。该方法包括:获取原始音视频数据,并从原始音视频数据提取原始视频帧和音频信号,其中,音频信号包括带噪音频;对所述原始视频帧进行特征提取,得到面部特征...
  • 本发明公开了一种语音处理方法及系统,其中方法包括获取电力调度过程中的实时语音流;对实时语音流进行分帧处理,并对得到的各待处理语音帧依次进行时域特征提取与分析,得到各待处理语音帧的语音重叠状态;在语音重叠状态满足第一重叠条件时,将对应的第一待...
  • 本申请提供了一种语音识别方法、装置及终端设备,适用于数据处理技术领域,该方法包括:根据多个待识别语料信息,计算多个待识别语料编辑距离信息;根据多个待识别语料信息、多个待识别语料编辑距离信息以及预设的待识别语料编辑距离阈值,生成多个待识别易混...
  • 本发明提供一种识别模型训练方法、识别方法、装置、设备及介质,该方法包括:根据样本音频和文本标签,对预训练的语音识别模型训练,得到预训练的语音识别模型中适配器模块的优化模型参数和大语言模型的模型参数对应的秩分解增量参数的第一优化参数;根据样本...
  • 本申请涉及计算机技术领域,尤其涉及一种语音识别模型的训练方法、语音识别方法及相关装置,用于高效、自动化的构建音视频资源的训练样本,以快速提升语音识别模型的语音识别精度。该方法中,对待处理资源的资源描述信息进行词元拆分,得到多个候选词元;基于...
  • 本申请实施例提供了一种语音生成方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:预设语音增强模型用于:提取训练提示语音数据的训练语音特征,将训练语音特征过滤得到选定语音特征,对选定语音特征和训练提示语音数据解码得到增强语音...
  • 本申请提供一种手术核查方法、装置、电子设备以及存储介质,涉及智能体技术领域,用于确保身份验证的真实性以及内容验证的准确性,该方法,包括:获取手术室内的待核查人员的音频流数据;对音频流数据进行声纹特征验证,得到待核查人员的初始身份验证结果;在...
  • 本申请实施例涉及人机交互技术领域,具体涉及一种基于对话流引擎的智能交互方法、计算机设备及存储介质。方法包括:获取目标用户请求及渠道信息,目标用户请求包括用户输入信息;基于渠道信息加载对应场景的预设的对话流配置;基于用户输入信息获取目标任务信...
  • 本申请提供了一种智能语音指令门锁设备及控制方法,运用于门锁设备技术领域,提高识别准确度:通过预处理语音指令和比对预存语音模式,可以减少噪音和语音变异对语音识别的干扰,从而提高识别准确度,用户的语音指令可以更加准确地被识别和理解,确保门锁操作...
技术分类