Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开一种基于大语言模型的语音交互方法、系统、设备及介质,涉及人机交互技术领域。所述方法包括:获取用户语音并转化为文本内容;基于大语言模型对所述文本内容进行意图识别获得意图类型,根据所述意图类型获取与之对应的调用参数;根据所述意图类型和...
  • 本申请实施例提供一种语音唤醒链路切换方法及电子设备,涉及智能语音控制技术领域。所述方法通过获取多个麦克风对当前播放音频进行录制获得的检测音频数据,并从检测音频数据中提取包括单个麦克风的录制能量值和任意两个麦克风的录制对比结果的音频能量特征。...
  • 本说明书实施例公开了一种语音业务执行方法,在目标应用的应用界面上显示语音控件对应的初始化状态下的UI组件,当UI组件被触发时,采集用户的语音指令,并根据语音指令确定要向该用户提供的各候选服务,并以变形动画的形式增大该UI组件的可视区域,作为...
  • 本发明涉及语音识别技术领域,特别涉及音乐创作中结合上下文的模糊语音指令解析系统,显著提高语音识别准确率:通过结合专业领域优化和上下文感知技术,本发明在音乐创作场景下的语音指令识别通过率显著提升;增强系统的实用性和易用性:本发明能够有效理解用...
  • 本申请涉及人工智能技术领域,提供了TWS耳机的智能交互方法、装置和存储介质。所述方法包括:通过耳机的多麦克风阵列持续采集环境声音,基于声源定位算法识别环境声音中的声学特征并据此判定是否生成预激活指令;响应于预激活指令,通过耳机端的第一阶段关...
  • 本发明涉及智能语音交互技术领域,且公开了一种基于BLE网络的AI语音扩展方法及其系统,其中一种基于BLE网络的AI语音扩展方法,包括至少一个AI交互节点、多个用户交互节点和若干中继节点,所述AI交互节点用于接收并处理来自用户交互节点的语音数...
  • 本申请提供一种语音响应数据的处理方法、装置、设备、存储介质及产品。包括:用户在进行语音交互过程中,获取针对用户生成的语音响应数据;获取语音响应数据的语音信号;对语音信号进行分帧处理,得到多帧语音信号;对各帧语音信号进行特征提取,获取能量特征...
  • 本发明公开了一种音频内容检测方法、装置、设备、介质及产品,涉及人工智能技术领域,尤其涉及音频特征处理和内容安全技术领域。该方法包括:通过发音嵌入模型对待检测音频进行嵌入处理,得到目标嵌入向量;其中,所述发音嵌入模型通过样本敏感词的音频三元组...
  • 本发明公开了一种内容检测方法、装置、设备、介质及产品,涉及人工智能技术领域,尤其涉及语音语义理解、内容安全和分布式技术领域。该方法包括:通过音频接入服务采用环形缓冲区技术实时接收待检测音频,并对待检测音频进行分段,得到至少一个待检测音频片段...
  • 本发明提供一种断续输入重拼接的实时AI智能客服交互方法及设备,监听并记录自动语音识别模块输出的最终文本片段及其到达时间;计算当前片段与上一片段的到达时间差,丢弃当前片段或执行合并策略;根据预设的合并策略,将上一文本片段与当前文本片段进行拼接...
  • 本申请实施例提供了一种实时语音对话方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:获取训练历史对话文本、训练输入语音数据和训练答复语音数据;通过预设语音对话模型对训练历史对话文本和训练输入语音数据进行答复预测得到预测答复...
  • 本发明涉及语音语义技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音交互的控制方法、装置、设备及介质,包括:获取多模态感知数据构建动态场景模型;提取会话特征参数输入决策模型生成策略参数集合;依据策略参数集合和语音交互设备语音特...
  • 本申请提供了一种低功耗自定义唤醒方法、装置、电子设备及存储介质,涉及电子设备技术领域,上述方法包括:获取待识别语音数据;利用预先训练的融合特征提取模型,提取待识别语音数据的文本与声纹的融合特征;其中,融合特征提取模型是利用预先建立的批量二维...
  • 本发明公开了一种基于大语言模型融合的语音对话交互方法及系统,包括:获取用户的实时语音流数据,对音流数据进行识别,获取第一文本数据;对第一文本数据进行意图识别,提取语义中的意图和意图对应的槽位信息;提取实时语音流数据的元数据,基于元数据、意图...
  • 本申请提供一种车载无人机语音控制系统、方法、电子设备及介质,涉及智能语音交互领域,该系统包括:语音采集模块,设置于车辆的前后保险杠及侧裙区域,用于采集用户的语音指令;语音处理模块,与语音采集模块通信连接,用于对采集到的语音指令进行声纹认证;...
  • 本申请涉及语音生成技术领域,具体公开了一种基于频谱图的语音问答生成方法、装置、设备及存储介质。将提问语音音频转换为梅尔频谱图而非离散语音量化处理,保留了丰富的声学特征和语义信息,提高了回答文本和语音的准确率,并采用流式传输方式,无需等待完整...
  • 本发明涉及电动车控制技术领域,公开了一种电动车的仪表控制面板交互方法与系统,该方法包括:利用多维传感器按照默认采样率实时采集骑行数据;通过微动力学估算与一维鸟瞰图映射,识别电动车当前的行驶场景;并通过双重防抖与预测验证,输出包含时序预测与量...
  • 本申请涉及一种基于神经网络的智慧课堂语音识别方法、系统、设备及介质。所述方法包括:获取课堂环境的带噪语音数据并进行特征提取得到语音特征集合;通过噪声分类器识别主导课堂噪声类型得到噪声类型标识;通过噪声类型标识对应的卷积核配置对语音特征集合进...
  • 本申请公开一种咖啡机语音交互方法及系统,涉及语音交互技术领域。该方法包括:在咖啡机未进行语音交互时,对厨房空间进行探测并监听环境背景声音,构建并动态更新至少表征噪声源物理位置、声学特征及声反射路径的厨房环境声学空间模型;检测到用户语音指令时...
  • 本申请公开了一种音频处理方法、装置、设备、介质、产品,该方法包括:获取音频序列,该音频序列包括第一序列和第二序列,该第一序列中至少一帧音频在该音频序列中对应的采集时间早于该第二序列中各帧音频在该音频序列中对应的采集时间,该第一序列和该第二序...
技术分类