Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及一种音频采集方法、装置、设备以及介质,涉及语音交互技术领域,该方法包括:获取目标音频的目标有效帧以及标识帧;所述目标有效帧为与所述标识帧邻接的有效帧,所述标识帧包括缓存帧以及补充帧;根据所述目标有效帧的振幅以及过零率提取所述标识帧...
  • 本发明公开了一种展厅导览机器人的语音交互方法、装置、电子设备及存储介质,属于语音信号处理领域,所述方法包括:实时采集展厅多通道远场语音信号,并同步获取导览机器人的音频参考信号、定位坐标及麦克风阵列结构。依据背景噪声功率谱计算噪声抑制参数,对...
  • 本公开涉及一种AI驱动的泛屏运营方法、装置及电子设备。该方法包括:响应于接收到由运营人员输入的运营指令,对运营指令进行解析,并识别运营意图,其中运营指令为基于自然语言的指令;基于运营意图调用至少一个AI服务,以生成与运营意图对应的运营操作序...
  • 本发明公开了基于远场语音的唤醒处理方法、装置、终端设备,涉及语音识别唤醒技术领域,包括:对检测到的唤醒音频进行分析处理,计算唤醒置信度评分;进行第一级判断:当计算出的唤醒音频的唤醒置信度评分大于或等于预设阈值,则确认此次唤醒有效并控制进入正...
  • 本发明涉及氛围灯控制技术领域,且公开了一种智能氛围灯的灯光音乐同步控制方法及音频优化系统,其中一种智能氛围灯的灯光音乐同步控制方法,包括利用收音模块对接收到的声音采用谱减法去噪与增强,并获取梅尔谱特征与声音能量。本发明通过收音模块接收声音,...
  • 本申请提供了一种基于大模型的气象信息语音交互处理方法,涉及人工智能、语音识别、自然语言处理和气象信息服务技术领域,包括:利用音频采集设备获取用户的语音信息,并通过语音识别技术将其转化为文本。系统依据预设的意图识别提示词库对文本进行解析,准确...
  • 本申请实施例提供了一种语音交互方法、系统及装置,涉及智能语音技术领域,其中,一种语音交互方法,包括:响应于目标语音设备识别到目标用户,指示目标图像采集单元针对所识别到的目标用户的行为路线进行监测,按照监测到的行为线路,控制目标语音设备的目标...
  • 本发明公开了一种设备唤醒方法、装置、设备、介质及计算机程序产品,所述方法包括:若多个待唤醒设备均接收到用户的唤醒音频,基于每个待唤醒设备接收到的唤醒音频,确定所述多个待唤醒设备中任意设备之间相对于所述用户的距离比、以及所述每个待唤醒设备相对...
  • 本发明公开了一种设备唤醒方法、装置、设备、介质及计算机程序产品,所述方法包括:若位于相同空间内的多个待唤醒设备均接收到用户的唤醒音频,确定每个待唤醒设备接收到的唤醒音频的能量值;若所述多个待唤醒设备中存在能量值之间的误差小于预设误差的多个第...
  • 本申请公开了一种基于多模态的语音触发控制系统和方法,包括:数据采集模块用于获取麦克风信号与柔性传感器信号并分别进行预处理;发声意图判断模块用于基于声学预处理信号和柔性预处理信号进行发声意图的判断;播放判断模块用于仅在预设时间间隔内接收到第一...
  • 本发明公开了一种基于虚幻引擎的车载数字人语音交互系统及方法。本发明包括语音采集模块:采用麦克风阵列,支持降噪处理;自然语言处理模块:集成经过微调的大语言模型,通过语音识别后的文本判断用户情感,输出情感标签和回答文本;流式语音合成模块:采用神...
  • 本申请提供了一种用于实现极速响应的流式asr构建方法及系统,包括获取情绪感知模型、并将所述情绪感知模型部署在声学模型内;获取表达习惯模型,并将所述表达习惯模型部署在语言模型内;获取上文输入,基于所述情绪感知模型、及所述表达习惯模型由所述上文...
  • 本申请涉及一种用户情感陪护式交互方法、装置和计算机设备。所述方法包括:通过多模态设备唤醒方式,获取用户的输入信息,并基于所述输入信息,通过用户语音识别策略,识别所述用户的当前语音内容;基于所述当前语音内容,通过解析理解策略,识别所述用户的语...
  • 本发明提出一种英语发音纠偏辅助系统,包括采集用户英语语音输入的麦克风、存储标准英语发音模型和用户发音历史数据的存储单元、对用户发音与标准发音进行实时比对分析的处理器、输出纠偏反馈信息的反馈单元;所述麦克风的输出端与所述处理器的输入端连接,所...
  • 本公开的一个或多个实施例提供一种语音识别模型的训练方法及相关设备,该语音识别模型的训练方法包括:获取多条场景种子数据;针对每条场景种子数据,利用语种识别模型对场景种子数据进行语种识别,确定场景种子数据的语种分布特征;根据多个场景种子数据对应...
  • 本申请属于大模型训练技术领域,提供一种基于语音对话掩码的多模态训练方法、设备、介质和程序产品,该方法包括,获取含多轮交互用户语音输入与AI回复文本的多模态训练数据;再从回复相关性、信息有效性及表达完整性维度,对每轮AI回复文本评分并输出具体...
  • 本申请公开了一种基于语音合成的音频渲染方法、装置、设备及存储介质。在本方案中,对音频渲染时,可通过目标文本确定场景概率分布,并将场景概率分布与干声音频的声学统计特征进行融合后得到参数向量,将其映射生成渲染器参数,以便基于渲染器参数对干声音频...
  • 本公开提供了一种音频生成模型的训练方法、音频生成方法、装置及设备,属于多媒体技术领域。方法包括:获取多个音频片段;基于多种事件合成方式,对多个音频片段进行合成,得到多个参考音频;对多个参考音频中的任一参考音频,基于参考音频生成提示信息,提示...
  • 本发明公开了一种勺型声学黑洞波导杆声发射信号增强结构,涉及波导杆技术领域,该勺型声学黑洞波导杆声发射信号增强结构,包括圆柱形的均匀杆,所述均匀杆的一端一体成型有声学黑洞渐变段,声学黑洞渐变段的形状为锥台形,声学黑洞渐变段远离均匀杆的一端固定...
  • 本发明公开了基于扩散模型的无人机自噪声动态抵消与目标声增强方法,包括如下步骤:IMU传感器获取无人机姿态数据,麦克风阵列录制含动态自噪声与目标声的混合声信号;经扩散模型前向扩散模拟动态自噪声,结合波形损失、频谱损失优化,建立姿态‑动态自噪声...
技术分类