Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于多层感知融合的鲁棒音视频语音识别方法及装置, 属于音视频多模态语义建模与语音识别技术领域。该方法利用音频与视觉双模态输入, 在训练阶段引入教师‑学生结构, 通过自蒸馏机制指导学生模型在多种噪声条件下学习稳定的语义表示。为...
  • 本发明公开了一种基于录音录像的ASR识别增强方法。该方法通过融合银行业务双录场景中的音频和环境特征信息, 提高金融服务交互过程中语音识别的准确性和合规性。首先, 构建针对银行网点环境的声学模型, 同时提取客户与工作人员对话的音频特征和交互场...
  • 本发明提供了一种基于双层架构语音分割的智慧课堂交互分析方法, 涉及语音分割技术领域, 具体包括如下步骤:利用梅尔频率倒谱系数MFCC提取语音信号的语音特征。设计文本增强的基于多尺度时序感知时延神经网络, 对语音特征进行粗筛, 将音频片段分为...
  • 本申请提供一种智能眼镜AI语音交互方法, 包括:同时采集用户手势图像和语音信号, 获取用户历史交互记录, 提取手势图像的关键点坐标和指向方向信息, 并获取手部距离信息, 生成手势运动路径, 同时提取语音信号的频谱信息和语调峰值, 形成语音节...
  • 本发明提供一种用于磨砂机的语音智能交互系统, 包括提供智能化磨砂机及智能云端, 所述智能化磨砂机内设逻辑控制模块、工控模块、语音模块及操作显示模块, 所述工控模块分别与所述逻辑模块及语音模块连接, 所述操作显示模块与所述逻辑控制模块相连, ...
  • 本申请的实施例提供了一种家居场景语音指令纠偏方法、系统及相关设备。其中, 方法包括:在目标语音指令对应的目标意图存在模糊的情况下, 根据目标语音指令, 确定目标用户对应的身份信息, 和/或, 位置信息;根据身份信息, 和/或, 位置信息, ...
  • 本发明提供了一种车载语音控制方法、装置及系统, 涉及智能汽车技术领域, 通过穿戴设备与车载传感器融合实现低功耗精准唤醒, 结合本地‑云端混合模型解析语音指令, 并根据车辆实时状态赋予安全等级标签, 提升危险操作拦截率。基于安全等级构建强化学...
  • 本申请公开了一种基于语音信息的药品名称识别方法、装置及电子设备, 涉及语音识别技术领域, 其中, 该方法包括:在获得用户授权的情况下, 采集用户在目标门店的语音信息;根据目标门店销售的每种药品的相关信息, 确定该药品对应的权重值, 其中, ...
  • 本发明涉及语音识别技术领域, 尤其涉及一种利用AI语音识别的英语发音纠正方法。包括:采集学习者的英语发音音频数据, 对英语发音音频数据进行预处理, 得到预处理后的英语发音数据, 对预处理后的英语发音数据利用自适应卷积时频特征提取算法提取得到...
  • 本公开涉及人工智能与酒店信息化管理交叉领域, 尤其涉及酒店知识库自学习修正方法、系统、设备及介质。该方法包括:获取客户通话语音流, 进行预处理, 得到语音数据;将所述语音数据输入预设的多模态分析模型和增量学习模型, 产生知识修正决策;基于知...
  • 本发明涉及一种基于云平台的物联网智能家居语音终端控制方法及系统, 属于智能家居语音控制技术领域。方法包括步骤:将当前进行语音交互用户的居家位置数据作为先验知识对采集的语音数据通过权重动态调整完成自适应波束成形处理;对波束成形处理后的语音数据...
  • 本发明提供一种基于养老机器人的语音控制方法、系统及养老机器人, 涉及人工智能与养老监护技术领域。本发明首先根据医学术语集筛选紧急求助关键词并构建关键词典库, 匹配语音文本以识别紧急语义意图;之后利用训练完毕的姿态识别模型和CNN模型, 基于...
  • 本发明涉及语音指令分析领域, 尤其涉及一种急救团队实时语音指令分析与协作优化方法及系统, 实时获取急救场景中的多通道语音流数据;基于多通道语音流数据, 采用语音识别模型生成初始文本指令, 并通过医学本体知识库进行术语标准化校正;根据校正后的...
  • 本发明公开了一种语音空调的控制方法、装置、语音空调及介质。本发明涉及空调技术领域, 方法包括:获取方言指令对应的方言语音及口型视频;对所述方言语音进行处理得到声学特征, 对所述口型视频进行处理得到视觉特征;将所述声学特征和所述视觉特征进行融...
  • 本发明涉及模型语音交互技术领域, 具体公开了多智能体协同的医疗卒中随访语音对话系统及其构建方法;本发明通过设置语音交互模型、planning_agent模块、检索知识agent模块、question_rewrite_agent模块和mess...
  • 本申请公开了一种基于语言处理模型的业务处理方法及装置。本申请涉及金融科技技术领域, 该方法包括:响应于业务请求, 获取通过目标帐号发送的音视频数据;在音视频数据包含干扰性数据的情况下, 通过对音视频数据进行预处理, 得到用于描述业务请求的真...
  • 本申请公开了一种车辆控制方法、装置、设备及计算机可读存储介质, 属于车辆技术领域。该方法应用于移动终端, 移动终端和车辆的车载终端互联, 该方法包括:采集语音数据;对所述语音数据进行文本转换, 得到所述语音数据对应的第一文本;在所述第一文本...
  • 本发明涉及语音识别与合成技术领域, 揭露了一种基于用户行为的多模态语音转换方法及系统, 包括:对骨导信号进行振动分离, 得到分离振动信号, 将脸肌微电流映射为肌肉形变梯度, 通过隐式行为数据分析用户的意图强度;将肌肉形变梯度映射为用户的语音...
  • 本申请实施例提供了一种机械臂装置以及机器人, 装置包括语音识别单元, 用于采集并对语音命令进行语义识别, 输出指令语义识别结果;机械臂单元, 包括机械臂, 机械臂单元用于根据机械臂控制信号控制机械臂的动作;机械臂控制SOC单元, 连接上述两...
  • 本发明公开了一种航天器发令方法、系统、电子设备和存储介质, 涉及航天器控制技术领域, 方法包括:建立多目标航天器数据库;当目标航天器的地面控制端通过语音发出发令申请时, 对发令申请对应的音频进行识别, 识别得到目标发令测站、目标指令的代号和...
技术分类