Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种文本处理方法及装置,应用于将文本通过文字转换语音模型转换为语音的场景中,所述文本处理方法包括:根据文本获取场景类型以及当前文本处理阶段中的至少一者,确定当前文本拆分长度的至少一个约束条件;根据确定出的至少一个约束条件,确定本...
  • 本发明属于数据处理技术领域,涉及了一种基于生成对抗网络的航空语音生成方法及系统,旨在解决语音生成技术在航空领域存在的语境感知能力弱、关键术语准确性低、噪声环境鲁棒性差及机载部署难的问题。本发明包括:获取文本指令及多维航空语境信息,预处理得到...
  • 本申请公开了一种语音同传系统测试方法及相关装置,涉及系统测试技术领域,语音同传系统测试方法包括:获取测试音频集,将测试音频集中的测试音频输入语音同传系统进行处理,根据语音同传系统对于测试音频集中测试音频的处理情况数据确定语音同传系统在用户体...
  • 本发明公开了一种基于声乐直播课堂的音乐教学方法及系统,涉及音乐教学技术领域,包括分别采集声乐直播课堂中教师端和学员端的音频信号进行预处理,生成教师、学员帧级声学特征向量;基于教师、学员帧级声学特征向量,通过映射、域判别和CTC模型,生成映射...
  • 本申请公开了一种哼唱检测方法、系统开启方法及相关装置,哼唱检测方法包括:获取目标场景中的目标音频片段;获取目标音频片段的音频特征;利用哼唱检测模型,通过对音频特征进行多层次时频分析,提取高阶全局特征,并以高阶全局特征为依据,对目标音频片段进...
  • 本申请公开了一种语音唤醒模型训练方法及电子设备,其中,语音唤醒模型为语音助手对应的用于实现语音助手语音唤醒检测的模型,该语音唤醒模型训练方法包括:确定目标用户对应的多个目标历史唤醒词数据,确定各目标历史唤醒词数据对应的目标用户行为信息;根据...
  • 本发明涉及人工智能监控技术领域,具体为一种评标现场多模态行为合规监控方法及系统,包括以下步骤:在评标室内部署阵列麦克风与高清摄像机同步采集评标专家及工作人员的声音和图像数据,同时通过蓝牙低功耗或超宽带标签实时采集人员位置信息;有益效果为:在...
  • 本申请提供了一种调音方法、装置、电子设备及介质,所述方法获取目标音频的全局语义特征和目标音频中每个段落的段落信号特征;基于目标音频的所述全局语义特征和每个段落的段落信号特征,生成针对目标音频的目标提示文本;所述目标提示文本包括对所述目标音频...
  • 本申请提供了一种音频识别方法及装置、电子设备、存储介质,属于音频处理技术领域,该方法包括:对非语音类信号进行傅里叶变换,得到噪音频域信号,并计算非语音类信号中背景噪音信号的第一功率谱密度;对语音类信号进行傅里叶变换,得到语音频域信号,并基于...
  • 本发明提出了一种用户端计算边结合的实时语音命令词识别方法,包括:步骤1,在用户端进行语音采集;步骤2,对采集到的语音信号进行数据预处理,并将预处理后的语音信号分块上传至计算中心;步骤3,计算中心合并还原分块的语音信号,并进行语音识别,将语音...
  • 本发明提供一种智能玩具的控制方法,该方法包括:在接收到用户的当前对话数据时,确定出当前对话数据中是否包含有日常习惯知识库中对应的特征;若当前对话数据中包含有日常习惯知识库中对应的特征,在日常习惯知识库中确定出目标日常习惯知识子库,日常习惯知...
  • 本发明提供一种智能玩具的控制方法,该方法包括:在接收到用户的当前对话数据时,确定出当前对话数据中是否包含有情感社交知识库中对应的特征;若当前对话数据中包含有情感社交知识库中对应的特征,确定出用户的目标情感对话策略以及用户的目标个人信息库,个...
  • 本发明提供一种智能玩具的控制方法,该方法包括:在接收到用户新的对话数据时,确定出对话数据的对话意图;基于对话意图,确定出目标知识库;获取智能玩具的性格特征,基于目标知识库,对对话数据进行问答处理,得到答案数据,并控制智能玩具输出与性格特征对...
  • 本发明涉及语音交互技术领域,具体公开了一种边缘语音确认装置及其确认方法。该装置可部署于穿戴设备、玩偶、语音盒子等多种载体中,集成本地语音识别模块、语音回放模块、通信模块、缓存单元和用户反馈模块。方法包括:通过语音采集模块获取用户语音输入,边...
  • 本发明提供一种语音问答场景下的RAG召回率提升方法及装置,涉及数据处理的技术领域,方法包括:对包含语音识别结果的原始语料进行语义清洗处理,并对清洗后的原始语料进行语义压缩,并利用多个候选嵌入向量生成模型分别执行向量生成操作,输出词向量;针对...
  • 本申请实施例提供了一种指令识别方法、装置、电子设备及可读介质,获取用户对预设的家居设备的请求文本;基于请求文本,判断请求文本是否满足预设的简单请求条件或预设的复杂请求条件;若请求文本满足简单请求条件,则将请求文本输入预设的第一指令识别模型,...
  • 本发明提供一种基于蓝牙通讯技术的离线语音识别阈值切换方法、系统、电子设备及存储介质,S1:配置目标设备与终端设备通过蓝牙方式建立通讯连接,终端设备向目标设备发送第一控制指令;S2:目标设备接收到第一控制指令后,向终端设备发送包含全部唤醒词、...
  • 本发明实施例提供一种智能音响控制方法及系统,属于数据控制技术领域。该方法包括:采集目标用户对目标音响进行控制时的第一语音数据, 并获得目标音响所处的目标环境下的第二语音数据;根据第一语音数据的语音特征从第二语音数据中获得与第一语音数据存在相...
  • 本发明公开了一种融合视觉识别与语音交互的四足机器人货物摆放纠正方法,包括如下步骤:S1、采集并预处理货物图像,生成标准化图像输入集合;S2、构建空间状态感知模型,提取图像特征并生成误差向量;S3、识别用户语音并提取方向与动作指令等语义关键词...
  • 本发明公开了一种基于四足机器人的智能语音识别与自然语言交互方法,包括如下步骤:S1、采集用户语音指令并生成标准化语音文本,提取语义关键词集合;S2、采集四足机器人多源感知数据并生成结构化状态数据张量;S3、构建多模态协同建模机制,生成多模态...
技术分类