Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种用于空地通信智能语音识别与执行的系统和方法。该系统包括:语音处理模块, 其用于自动识别接收到的语音信号以生成一个或多个翻译文本;将所述一个或多个翻译文本进行逐词对比;根据逐词对比的结果和一个或多个置信度阈值来确定最终文本;以...
  • 本发明涉及一种充电设备云端通话故障诊断方法、装置及计算机设备, 属于设备通讯技术领域, 方法包括:建立通信通道并加载含语音识别引擎的交互模块, 通过分帧处理、声学模型匹配将用户自然语言描述转化为包含充电异常关键词的文本化故障特征组;基于故障...
  • 一种车载多音区语音处理方法及系统, 属于车载语音处理领域, 包括如下步骤:步骤一:通过声音接收器获取声音信息并将其转换为电信号;步骤二:将电信号转化为数字信号并进行数字信号处理;步骤三:通过对获取的数字信号进行降噪处理, 并对降噪后的数字信...
  • 本发明提供了一种设备唤醒方法、装置及烟机设备, 涉及智能控制的技术领域, 该方法包括:获取当前唤醒设备录制的语音信息;对语音信息中包含的预设噪声频谱进行消除处理, 得到语音信息对应的目标语音信息;对目标语音信息进行唤醒识别, 得到识别结果,...
  • 本发明公开了一种智能对话唤醒控制方法、对话系统、智能设备及存储介质, 属于智能设备技术领域。本发明通过控制麦克风采集语音数据, 并接收触摸传感器检测按键的触控检测数据;根据所述语音数据和所述触控检测数据计算用户交互概率;当所述用户交互概率高...
  • 本申请提供了一种语音打断处理方法及装置、电子设备、存储介质, 属于人工智能技术领域, 该方法包括:获取针对电子设备的语音打断指令, 确定语音打断指令与预测指令之间的匹配度;预测指令是在第一时刻预测得到的指令, 第一时刻为当前时刻的上一个时刻...
  • 本申请涉及语音交互技术领域, 尤其涉及一种基于动态风险评估确定语音回复策略的方法及系统, 包括响应于用户发起的语音交互请求, 获取用户输入并调用预训练的大语言模型输出风险评分;基于预设风险阈值对风险评分进行等级划分, 包括高风险、中风险以及...
  • 本发明提供一种基于分层式混合模型的具身智能机器人的控制方法, 涉及具身智能领域。本发明基于协同式混合模型架构, 按照ASR文本对应的任务复杂度动态分配处理路径, 将简单任务分配至低延迟的本地文本小模型处理, 将复杂任务分配至高精度的远程多模...
  • 本申请提供了一种驱动方法及相关装置, 该驱动方法基于本申请提供的给予全卷积架构的目标预测模型实现, 可以适用在手机、平板等性能算力较小的移动端上, 能有效扩大了语音驱动模型的应用场景;此外, 由于本申请提供的目标预测模型能根据用户下发的语音...
  • 本发明公开了高精准度多语言实时同传字幕生成方法, 包括以下步骤:操作端选择人工字幕发送模式或机器自动识别字幕发送模式, 选择一种或多种目标语言, 分别形成相应目标语言的字幕信息并根据上会嘉宾的演讲进度发送给投屏端;投屏端接收相应目标语言的字...
  • 本发明公开一种融合多模态感知的智能朗读反馈评估系统, 涉及语言学习技术领域。系统包括音频输入模块采集用户朗读语音, 语音处理模块将语音转文本并提取节奏参数, 双语内容存储模块存双语对应数据, 耳返反馈模块检索目标语言音频并按节奏参数调整播放...
  • 本发明实施例公开了涉及一种语音陪练方法、装置、电子设备及存储介质。该方法包括:获取语音陪练的通用提示词和当前拨测内模拟业务场景中当前轮次对话对应的当前提示词;基于通用提示词、当前提示词和预设文本生成模型, 准确且便捷地生成当前播报文本, 提...
  • 本公开实施例公开一种语音转文字中的关键指代解析方法、装置、介质及产品。其方法包括:构建用户的人际关系知识图谱并按照人际关系类型拆分;用户语音转化的文字序列中包含第三人称代词且满足预设条件时, 获取上下文信息并以此获取第三人称代词的指代对象、...
  • 本发明涉及一种融合嘴部气流、嘴型和语音数据的语音识别装置和方法, 装置包括头戴式主体支架、传感器阵列采集装置和数据处理装置;所述头戴式主体支架包括头戴式支架和传感器支架;所述传感器阵列采集装置包括支座、气流采集模块、图像采集模块和语音采集模...
  • 本发明实施例公开了一种音频处理方法、系统和电子设备, 本实施例的服务端通过接收并识别音频信号, 向客户端反馈流式音频识别结果, 响应于检测到计时时长达到静音配置时长, 发送静音提示信号, 响应于接收到终止信号, 确定音频识别完成, 返回识别...
  • 本发明涉及声纹识别技术领域, 具体涉及一种基于多专家模型的声纹识别方法及其系统;方法包括:采集用户的声纹信号;对采集到的声纹信号进行降噪和归一化操作, 为后续的特征提取做好准备;从预处理后的声纹信号中提取出多个维度的特征, 并将特征输入多专...
  • 本发明涉及音频处理技术领域, 尤其涉及一种基于WeSpeaker架构的隐私增强型语音伪造检测方法, 在具体使用时, 本方法包括三个阶段, 第一个阶段是音频输入与隐私保护预处理阶段, 该阶段通过声学‑语义解耦技术实现语音内容的隐私保护。第二个...
  • 本发明公开了语音识别认证技术领域的基于多模态特征与动态评估的语音识别认证方法及系统, 包括采用麦克风采集用户的原始语音信号, 对所述原始语音信号进行预处理, 得到预处理语音数据;采用多维度特征分层提取技术提取所述预处理语音数据的特征数据, ...
  • 本发明公开了一种基于人工智能的语音处理方法, 属于语音识别技术领域。本发明首先将语音信号划分为多个短时帧, 通过过零率标记出平稳段和扰动段;随后提取平稳段‑平稳段、平稳段‑扰动段、扰动段‑平稳段及扰动段‑扰动段这四种组合;针对每个组合, 提...
  • 本发明涉及数字水印技术领域, 尤其涉及抗同步攻击的音频直方图形状水印方法, 包括:根据预分配的bin的数量, 对预选取的音频样本进行划分, 获取第一时域直方图;对所述第一时域直方图进行分段式DWT变换, 以及进行逆DWT变换, 获取嵌入水印...
技术分类