Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音交互技术领域,具体公开了一种边缘语音确认装置及其确认方法。该装置可部署于穿戴设备、玩偶、语音盒子等多种载体中,集成本地语音识别模块、语音回放模块、通信模块、缓存单元和用户反馈模块。方法包括:通过语音采集模块获取用户语音输入,边...
  • 本发明提供一种语音问答场景下的RAG召回率提升方法及装置,涉及数据处理的技术领域,方法包括:对包含语音识别结果的原始语料进行语义清洗处理,并对清洗后的原始语料进行语义压缩,并利用多个候选嵌入向量生成模型分别执行向量生成操作,输出词向量;针对...
  • 本申请实施例提供了一种指令识别方法、装置、电子设备及可读介质,获取用户对预设的家居设备的请求文本;基于请求文本,判断请求文本是否满足预设的简单请求条件或预设的复杂请求条件;若请求文本满足简单请求条件,则将请求文本输入预设的第一指令识别模型,...
  • 本发明提供一种基于蓝牙通讯技术的离线语音识别阈值切换方法、系统、电子设备及存储介质,S1:配置目标设备与终端设备通过蓝牙方式建立通讯连接,终端设备向目标设备发送第一控制指令;S2:目标设备接收到第一控制指令后,向终端设备发送包含全部唤醒词、...
  • 本发明实施例提供一种智能音响控制方法及系统,属于数据控制技术领域。该方法包括:采集目标用户对目标音响进行控制时的第一语音数据, 并获得目标音响所处的目标环境下的第二语音数据;根据第一语音数据的语音特征从第二语音数据中获得与第一语音数据存在相...
  • 本发明公开了一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法,包括如下步骤:S1、采集并预处理货物图像,生成标准化图像输入集合;S2、构建空间状态感知模型,提取图像特征并生成误差向量;S3、识别用户语音并提取方向与动作指令等语义关键词...
  • 本发明公开了一种基于四足机器人的智能语音识别与自然语言交互方法,包括如下步骤:S1、采集用户语音指令并生成标准化语音文本,提取语义关键词集合;S2、采集四足机器人多源感知数据并生成结构化状态数据张量;S3、构建多模态协同建模机制,生成多模态...
  • 本发明公开了一种融合ASR(自动语音识别)与情感识别的智能化呼叫动态响应方法及系统,应用于语音机器人与呼叫中心交互场景。通过实时同步分析用户语音的文本内容(ASR)和情感特征(如语调、语速、能量),动态调整机器人响应策略。当检测到负面情绪时...
  • 本申请提供了一种文本数据生成方法。可以应用于大数据技术领域和人工智能技术领域。该方法包括:获取第一时域语音信号,对所述第一时域语音信号进行预处理,生成多个第二时域语音信号。对所述多个第二时域语音信号进行声学特征提取,生成特征向量。将所述特征...
  • 本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括:接收当前轮次语音请求;根据所述当前轮次语音请求,以及历史轮次语音请求和/或车辆当前场景信息,对所述当前轮次语音请求进行敏感信息检测;根据敏感信息检测的结果,进行语音交互。如...
  • 本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括:根据用户语音请求和当前匹配树,确定用户语音请求和当前匹配树中的控件标签的匹配结果。接着,在匹配结果为第一预设匹配结果的情况下,根据当前匹配树,确定候选控件信息。然后,基于预...
  • 本发明提供一种语音交互方法及电子设备,针对第一用户语音,语音唤醒模块在检测到目标语音前端点时,获取预先生成的唤醒响应音频,在唤醒响应音频前插入目标标记帧形成目标音频,发送至音频检测管理模块,并进行音频播放初始化处理;音频检测管理模块检测到目...
  • 本申请公开了基于声学事件触发的坐席实时话术推荐方法及系统,涉及智能坐席客服技术领域,其中该方法包括:通过语音识别将通话音频流转化为文本,并结合客户的基本信息、历史交互数据及通话业务标签,构建文本特征向量;使用声学事件检测模型,识别通话中的声...
  • 本申请实施例提供一种语音控制方法、装置、车辆及电子设备,涉及智能座舱技术领域。该方法包括获取用户语音,并转化为文本;基于所述文本获取与用户意图对应的设备;获取所述设备的当前设备状态;基于所述文本和所述当前设备状态生成控制指令。可基于设备当前...
  • 本发明提供一种语音识别方法、装置、系统、电子设备和存储介质,其中方法应用于终端设备,包括:基于语音信号的语种信息,对语音信号进行声学特征提取,得到声学特征,并对声学特征进行解码,得到语音信号的多个初始识别结果;确定语音信号的语音识别结果;语...
  • 本申请提供了一种基于语音控制的XR交互方法、装置及设备,属于人机交互技术领域。该方法包括:接收多模态传感器获取的多模态交互数据流;对多模态交互数据流中语音信号识别解析,以确定相应的语音控制指令;其中,语音控制指令包括操作意图及空间描述;空间...
  • 本说明书实施例公开了一种音视频处理方法、装置、电子设备、存储介质及程序产品。所述方法包括:对待处理的第一音视频进行语音识别,得到第一文本;通过大模型,基于所述第一文本的文本内容将所述第一文本划分为具有层级关系的多个第一文本块,以及基于每个第...
  • 本发明公开了一种基于AR和VR的语言控制交互方法及系统,涉及AR与VR领域,通过麦克风阵列结构采集用户语音指令,经过混合降噪框架预处理后,利用模块化协同架构的自然语言处理模型进行文本转换与语义分析,提取交互意图和相关参数,模型通过动态增量训...
  • 本发明公开了一种基于预训练语音模型的多语种声纹识别方法,利用预训练语音模型WavLM与传统声纹识别模型ECAPA‑TDNN相融合。本发明引入多层感知机(MLP)模块,用于进一步提炼和转换WavLM提取的特征,使其更适合于ECAPA‑TDNN...
  • 本申请实施例提供一种声音来源判断方法及系统,所述方法在获取声音信号、振动信号等多模态检测信号后,可以根据多模态检测信号生成能量包络信号、经过滤波的振动信号以及瞬时生理响应特征等特征信号,再通过分窗处理将特征信号划分为多个分析窗口,以及基于分...
技术分类