Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本说明书实施例公开了一种语音业务执行方法,在目标应用的应用界面上显示语音控件对应的初始化状态下的UI组件,当UI组件被触发时,采集用户的语音指令,并根据语音指令确定要向该用户提供的各候选服务,并以变形动画的形式增大该UI组件的可视区域,作为...
  • 本申请实施例提供一种语音唤醒链路切换方法及电子设备,涉及智能语音控制技术领域。所述方法通过获取多个麦克风对当前播放音频进行录制获得的检测音频数据,并从检测音频数据中提取包括单个麦克风的录制能量值和任意两个麦克风的录制对比结果的音频能量特征。...
  • 本发明公开一种基于大语言模型的语音交互方法、系统、设备及介质,涉及人机交互技术领域。所述方法包括:获取用户语音并转化为文本内容;基于大语言模型对所述文本内容进行意图识别获得意图类型,根据所述意图类型获取与之对应的调用参数;根据所述意图类型和...
  • 本发明属于交互技术领域,公开了一种聋哑人双向交互方法,包括:采集对话人的语音,将语音转换为第一文字信息,将第一文字信息可视化显示给聋哑人用户,或转化为手语动作或手语示意图,显示给聋哑人用户,捕捉对话人的唇部形态图像,基于唇语数据库匹配生成第...
  • 本发明涉及智能机器人互动技术领域,具体涉及一种智能机器人互动方法,包括以下步骤:S1、构建模态质量评估模型,引入上下文语义一致性检测模型,生成模态置信度向量和语义一致性结果;S2、采用动态加权算法对所述模态置信度向量和所述语义一致性结果进行...
  • 本申请提供了一种智能语音指令门锁设备及控制方法,运用于门锁设备技术领域,提高识别准确度:通过预处理语音指令和比对预存语音模式,可以减少噪音和语音变异对语音识别的干扰,从而提高识别准确度,用户的语音指令可以更加准确地被识别和理解,确保门锁操作...
  • 本申请实施例涉及人机交互技术领域,具体涉及一种基于对话流引擎的智能交互方法、计算机设备及存储介质。方法包括:获取目标用户请求及渠道信息,目标用户请求包括用户输入信息;基于渠道信息加载对应场景的预设的对话流配置;基于用户输入信息获取目标任务信...
  • 本申请提供一种手术核查方法、装置、电子设备以及存储介质,涉及智能体技术领域,用于确保身份验证的真实性以及内容验证的准确性,该方法,包括:获取手术室内的待核查人员的音频流数据;对音频流数据进行声纹特征验证,得到待核查人员的初始身份验证结果;在...
  • 本申请实施例提供了一种语音生成方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:预设语音增强模型用于:提取训练提示语音数据的训练语音特征,将训练语音特征过滤得到选定语音特征,对选定语音特征和训练提示语音数据解码得到增强语音...
  • 本申请涉及计算机技术领域,尤其涉及一种语音识别模型的训练方法、语音识别方法及相关装置,用于高效、自动化的构建音视频资源的训练样本,以快速提升语音识别模型的语音识别精度。该方法中,对待处理资源的资源描述信息进行词元拆分,得到多个候选词元;基于...
  • 本发明提供一种识别模型训练方法、识别方法、装置、设备及介质,该方法包括:根据样本音频和文本标签,对预训练的语音识别模型训练,得到预训练的语音识别模型中适配器模块的优化模型参数和大语言模型的模型参数对应的秩分解增量参数的第一优化参数;根据样本...
  • 本申请提供了一种语音识别方法、装置及终端设备,适用于数据处理技术领域,该方法包括:根据多个待识别语料信息,计算多个待识别语料编辑距离信息;根据多个待识别语料信息、多个待识别语料编辑距离信息以及预设的待识别语料编辑距离阈值,生成多个待识别易混...
  • 本发明公开了一种语音处理方法及系统,其中方法包括获取电力调度过程中的实时语音流;对实时语音流进行分帧处理,并对得到的各待处理语音帧依次进行时域特征提取与分析,得到各待处理语音帧的语音重叠状态;在语音重叠状态满足第一重叠条件时,将对应的第一待...
  • 本申请实施例提供了一种基于人工智能的语音生成方法和装置、设备、存储介质,属于人工智能技术领域。该方法包括:获取原始音视频数据,并从原始音视频数据提取原始视频帧和音频信号,其中,音频信号包括带噪音频;对所述原始视频帧进行特征提取,得到面部特征...
  • 本发明提供一种多语种自动语音识别方法、系统、存储介质及电子设备,包括获取多个语种的字表的字表特征向量;获取语种标识符特征和识别标识符特征;获取待识别语音的声学特征矩阵;基于语种标识符特征、声学特征矩阵和识别标识符特征获取输出特征矩阵;基于所...
  • 公开了一种语音交互方法、语音识别模型的训练方法及电子设备。所述语音交互方法包括:获取源语言对应的语音数据;基于预先训练的语音识别模型,对所述语音数据进行语音处理,获得所述源语言对应的语音识别数据和目标语言对应的语音翻译数据;显示所述语音识别...
  • 本申请涉及语音合成技术领域,具体公开了一种基于副语言的语音合成方法、装置、计算机设备及介质。本申请通过韵律预测获得韵律特征,有效融合文本与参考声学信息,根据副语言标签序列获得副语言特征,进而协同利用文本特征、预测韵律特征与副语言特征合成目标...
  • 本发明涉及人工智能技术领域,公开了一种粤剧语音智能克隆及推荐方法,该方法包括:首先获取语音合成文本、用户与大语言模型的交互内容及用户上传语音;将语音合成文本输入预先训练的模型生成具有粤剧特色的语音;基于用户交互内容通过角色匹配确定系统提示词...
  • 提供用于具有语音克隆和虚拟形象的剪辑生成系统和方法。一种方法包括访问模板视频和接收输入文本,以及基于模板音频数据和输入文本生成克隆音频数据。该方法还包括从模板视频的连续视频帧中提取参考图像,并将克隆音频数据、参考图像和连续帧提供给视频生成模...
  • 本发明公开了一种基于长文本建模的个性化语音生成方法,属于语音合成技术领域。该方法先获取原始训练文本和音频形成原始数据集,进行预处理后得到标准化拼音序列;然后对改进注意力机制的TacotronV2模型进行批量训练,得到预训练模型Checkpo...
技术分类