Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种核应急医学救援智能语音辅助系统,涉及自然语音处理技术领域。该系统包括:语音识别模块,用于对核应急医学教学场景中的声波信号进行角色分离和片段重组,得到多个语音信号;其中,每个语音信号对应一个发言角色;语音检索模块,用于基于系统知...
  • 本申请实施例提供了一种用户意图的识别方法、装置、电子设备及可读介质,获取预设的用户对预设的待控制家居设备的语音指令,并采集待控制家居设备周围环境的环境参数、用户在环境中的用户位置信息以及当前时间中的至少一个;基于语音指令、环境参数、用户位置...
  • 本申请提供了一种语音控制方法、装置、电子设备及存储介质,涉及智能家居技术领域。方法包括:获取用户的待识别语音信号;将待识别语音信号输入至指令简化模型中,得到指令简化模型输出的目标控制指令;指令简化模型包括语音识别模型和语言简化模型,语音识别...
  • 本发明公开了一种车机控制方法、装置、设备及介质,其中,方法包括:获取用户语音数据,并对用户语音数据进行语音识别得到语音识别结果;在识别到用户语音数据对应的第一个有效字符时对当前页面进行截图操作,得到截图图片;基于截图图片和语音识别结果生成操...
  • 本申请涉及一种语音识别系统及其语音识别方法、电子设备及可读介质。该系统包括:中控设备,用于通过内置麦克风采集用户语音,执行意图识别引擎识别出的设备控制指令;语音识别引擎,用于接收并识别麦克风采集的用户语音,输出语音识别结果;意图识别引擎,用...
  • 本发明提供一种基于人工智能的场景联动音箱控制系统及方法,涉及音箱控制技术领域。包括:数据采集模块,采集用户语音指令和环境数据;数据预处理模块,对语音指令和环境数据进行预处理,得到预处理语境数据;人工智能处理模块,运用自然语言处理算法对预处理...
  • 本申请公开了一种车辆语音交互控制方法、装置、设备及存储介质,接收目标车辆的驾乘人员的第一语音数据;其中,第一语音数据用于调整目标车辆的应用场景,每个应用场景对应一组目标车辆中的若干执行器的动作参数;对第一语音数据进行解析,根据解析的结果从预...
  • 本申请实施例公开一种语音识别处理方法及装置,该方法包括:对车辆接收的当前轮次的第一语音请求进行预处理,获得第一文本;若第一文本满足修正前置条件,获取上一轮次的第二语音请求,对第二语音请求进行预处理,获得第二文本;根据第一文本和第二文本,检测...
  • 本公开涉及一种语音控制方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:通过第一语音处理系统接收麦克风模拟语音信号;第一语音处理系统为预设指令型语音处理系统;通过第一语音处理系统识别所述麦克风模拟语音信号,得到用户语音指令;通...
  • 本申请实施例公开了一种语音交互方法及装置、设备、存储介质,该方法应用于车载终端,包括:获取车载终端采集的音频信号;基于音频信号确定目标提示词,根据目标提示词得到音频信号的类型,音频信号的类型包括:可执行指令音频信号;在音频信号为可执行指令音...
  • 本发明提供一种分布式语音互动模块系统,包含至少一语音互动单元与一中央语意事件协调单元。每一语音互动单元具备语音唤醒、语音识别(ASR)、自然语言理解(NLU)、语音合成(TTS)与短期记忆功能,能独立处理用户语音输入,并生成语意事件上传。中...
  • 本发明涉及语音识别与智能家电控制技术领域,尤其涉及基于语音识别的电磁炉控制方法,包括:同步采集语音信号与唇部运动信号,经时戳对齐生成多模态感知数据;对数据进行跨模态抗噪处理,输出融合声学及视觉特征的融合特征张量;执行语义解析与危险指令识别,...
  • 本发明提供了基于多模型动态互验的语音交互方法、装置及电子设备,涉及人工智能语音交互技术领域,包括:获取用户语音数据;将所述用户语音数据输入至语音识别模型,得到带标点的中文文本及其对应的时间戳;对所述中文文本进行解析,通过熵值计算模型得到语义...
  • 本发明涉及语音数据处理技术领域,公开了一种基于语音意图追踪微代理的多业务语音导航方法及装置。实施本发明,通过对语音导航请求进行语音识别得到识别文本,再分别进行意图识别和关键词提取,能够准确把握用户语音请求中的核心意图和关键信息,有利于提高语...
  • 本发明公开了基于多模态融合的智能拾音与语音识别系统,涉及人工智能与语音识别交叉技术领域。系统包括主控制模块、多个拾音节点和多模态融合引擎,其中多模态融合引擎包含声源定位与分离、环境自适应降噪、跨模态特征融合及动态上下文理解四个核心组件。通过...
  • 本申请公开了一种语音唤醒模型训练方法、语音唤醒方法、设备及介质,涉及人工智能技术领域,方法包括:获取待训练的语音唤醒模型与预设置的目标唤醒词;将目标唤醒词输入至语音合成模型中,输出得到正样本语音数据,生成与正样本语音数据相对的负样本语音数据...
  • 本申请涉及一种语音识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,可用于计算机技术领域。该方法包括:通过语音识别系统对语音信号进行语音识别处理,得到初始识别文本;对初始识别文本中的字词进行拼音转换处理,得到第一拼音信息;对第...
  • 本申请公开了一种AI对话空闲状态检测方法、AI对话系统、设备及存储介质。该方法包括:实时采集音频数据并向服务器端上报音频数据;接收服务器端响应音频数据而回复的交互音频包,并读取交互音频包的字节长度;响应于交互音频包的字节长度不超过静默音频包...
  • 本申请实施例提供了一种模型优化方法、文本生成方法、装置及电子设备。模型优化方法,包括:确定待优化语言模型;获取偏好文本对;偏好文本对中包括:原始文本、偏好译文以及非偏好译文;偏好译文与原始文本之间的音频时长接近程度高于非偏好译文与原始文本之...
  • 本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统,涉及胸外科手术智能同声传译与规划技术领域, 方法包括:S1:基于环境音频信号与姿态检测信号形成多模态激活指令;S2 : 响应于多模态激活指令启动视觉传感器,形成增强语音特征信号;S3...
技术分类