Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种语音识别方法、装置及终端设备,适用于数据处理技术领域,该方法包括:根据多个待识别语料信息,计算多个待识别语料编辑距离信息;根据多个待识别语料信息、多个待识别语料编辑距离信息以及预设的待识别语料编辑距离阈值,生成多个待识别易混...
  • 本发明提供一种识别模型训练方法、识别方法、装置、设备及介质,该方法包括:根据样本音频和文本标签,对预训练的语音识别模型训练,得到预训练的语音识别模型中适配器模块的优化模型参数和大语言模型的模型参数对应的秩分解增量参数的第一优化参数;根据样本...
  • 本申请涉及计算机技术领域,尤其涉及一种语音识别模型的训练方法、语音识别方法及相关装置,用于高效、自动化的构建音视频资源的训练样本,以快速提升语音识别模型的语音识别精度。该方法中,对待处理资源的资源描述信息进行词元拆分,得到多个候选词元;基于...
  • 本申请实施例提供了一种语音生成方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:预设语音增强模型用于:提取训练提示语音数据的训练语音特征,将训练语音特征过滤得到选定语音特征,对选定语音特征和训练提示语音数据解码得到增强语音...
  • 本申请提供一种手术核查方法、装置、电子设备以及存储介质,涉及智能体技术领域,用于确保身份验证的真实性以及内容验证的准确性,该方法,包括:获取手术室内的待核查人员的音频流数据;对音频流数据进行声纹特征验证,得到待核查人员的初始身份验证结果;在...
  • 本申请实施例涉及人机交互技术领域,具体涉及一种基于对话流引擎的智能交互方法、计算机设备及存储介质。方法包括:获取目标用户请求及渠道信息,目标用户请求包括用户输入信息;基于渠道信息加载对应场景的预设的对话流配置;基于用户输入信息获取目标任务信...
  • 本申请提供了一种智能语音指令门锁设备及控制方法,运用于门锁设备技术领域,提高识别准确度:通过预处理语音指令和比对预存语音模式,可以减少噪音和语音变异对语音识别的干扰,从而提高识别准确度,用户的语音指令可以更加准确地被识别和理解,确保门锁操作...
  • 本发明涉及智能机器人互动技术领域,具体涉及一种智能机器人互动方法,包括以下步骤:S1、构建模态质量评估模型,引入上下文语义一致性检测模型,生成模态置信度向量和语义一致性结果;S2、采用动态加权算法对所述模态置信度向量和所述语义一致性结果进行...
  • 本发明属于交互技术领域,公开了一种聋哑人双向交互方法,包括:采集对话人的语音,将语音转换为第一文字信息,将第一文字信息可视化显示给聋哑人用户,或转化为手语动作或手语示意图,显示给聋哑人用户,捕捉对话人的唇部形态图像,基于唇语数据库匹配生成第...
  • 本发明公开一种基于大语言模型的语音交互方法、系统、设备及介质,涉及人机交互技术领域。所述方法包括:获取用户语音并转化为文本内容;基于大语言模型对所述文本内容进行意图识别获得意图类型,根据所述意图类型获取与之对应的调用参数;根据所述意图类型和...
  • 本申请实施例提供一种语音唤醒链路切换方法及电子设备,涉及智能语音控制技术领域。所述方法通过获取多个麦克风对当前播放音频进行录制获得的检测音频数据,并从检测音频数据中提取包括单个麦克风的录制能量值和任意两个麦克风的录制对比结果的音频能量特征。...
  • 本说明书实施例公开了一种语音业务执行方法,在目标应用的应用界面上显示语音控件对应的初始化状态下的UI组件,当UI组件被触发时,采集用户的语音指令,并根据语音指令确定要向该用户提供的各候选服务,并以变形动画的形式增大该UI组件的可视区域,作为...
  • 本发明涉及语音识别技术领域,特别涉及音乐创作中结合上下文的模糊语音指令解析系统,显著提高语音识别准确率:通过结合专业领域优化和上下文感知技术,本发明在音乐创作场景下的语音指令识别通过率显著提升;增强系统的实用性和易用性:本发明能够有效理解用...
  • 本申请涉及人工智能技术领域,提供了TWS耳机的智能交互方法、装置和存储介质。所述方法包括:通过耳机的多麦克风阵列持续采集环境声音,基于声源定位算法识别环境声音中的声学特征并据此判定是否生成预激活指令;响应于预激活指令,通过耳机端的第一阶段关...
  • 本发明涉及智能语音交互技术领域,且公开了一种基于BLE网络的AI语音扩展方法及其系统,其中一种基于BLE网络的AI语音扩展方法,包括至少一个AI交互节点、多个用户交互节点和若干中继节点,所述AI交互节点用于接收并处理来自用户交互节点的语音数...
  • 本申请提供一种语音响应数据的处理方法、装置、设备、存储介质及产品。包括:用户在进行语音交互过程中,获取针对用户生成的语音响应数据;获取语音响应数据的语音信号;对语音信号进行分帧处理,得到多帧语音信号;对各帧语音信号进行特征提取,获取能量特征...
  • 本发明公开了一种音频内容检测方法、装置、设备、介质及产品,涉及人工智能技术领域,尤其涉及音频特征处理和内容安全技术领域。该方法包括:通过发音嵌入模型对待检测音频进行嵌入处理,得到目标嵌入向量;其中,所述发音嵌入模型通过样本敏感词的音频三元组...
  • 本发明公开了一种内容检测方法、装置、设备、介质及产品,涉及人工智能技术领域,尤其涉及语音语义理解、内容安全和分布式技术领域。该方法包括:通过音频接入服务采用环形缓冲区技术实时接收待检测音频,并对待检测音频进行分段,得到至少一个待检测音频片段...
  • 本发明提供一种断续输入重拼接的实时AI智能客服交互方法及设备,监听并记录自动语音识别模块输出的最终文本片段及其到达时间;计算当前片段与上一片段的到达时间差,丢弃当前片段或执行合并策略;根据预设的合并策略,将上一文本片段与当前文本片段进行拼接...
  • 本申请实施例提供了一种实时语音对话方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取训练历史对话文本、训练输入语音数据和训练答复语音数据;通过预设语音对话模型对训练历史对话文本和训练输入语音数据进行答复预测得到预测答复...
技术分类