Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种说话主体识别方法、装置、设备及可读存储介质,应用于计算机技术领域,包括:从有效语音片段中进行声纹提取,得到声纹向量,确定各个声纹向量间的相似度,并基于相似度进行聚类,生成各个说活主体对应的临时标识;将无效语音片段标记为待确定...
  • 本发明公开了一种联合语音克隆的声纹比对方法及系统,包括以下步骤:构建联合语音克隆的声纹比对网络;训练所述声纹比对网络,获得训练好的声纹比对模型;利用所述声纹比对模型进行声纹比对;其中,所述声纹比对网络包括:语音编码器,对待比对语音进行编码,...
  • 本发明公开了一种基于声纹和热成像数据融合的动态身份监测系统,涉及信息安全与生物识别技术领域,通过采集用户面部热成像图像并输入预训练的深度神经网络模型,系统可判断用户是否处于异常状态如胁迫或紧张;同时,系统提取用户声纹特征与预注册模板进行比对...
  • 本申请涉及洗衣机智能控制技术领域,具体提供一种语音反馈方法、控制器、存储介质及终端设备,旨在解决现有语音识别方法无法满足用户的个性化需求导致用户体验感较差的问题。为此目的,本申请提供的方法包括:获取音频指令对应的发声人的图像信息,从图像信息...
  • 本发明涉及一种音频采集方法、装置、设备以及介质,涉及语音交互技术领域,该方法包括:获取目标音频的目标有效帧以及标识帧;所述目标有效帧为与所述标识帧邻接的有效帧,所述标识帧包括缓存帧以及补充帧;根据所述目标有效帧的振幅以及过零率提取所述标识帧...
  • 本发明公开了一种展厅导览机器人的语音交互方法、装置、电子设备及存储介质,属于语音信号处理领域,所述方法包括:实时采集展厅多通道远场语音信号,并同步获取导览机器人的音频参考信号、定位坐标及麦克风阵列结构。依据背景噪声功率谱计算噪声抑制参数,对...
  • 本公开涉及一种AI驱动的泛屏运营方法、装置及电子设备。该方法包括:响应于接收到由运营人员输入的运营指令,对运营指令进行解析,并识别运营意图,其中运营指令为基于自然语言的指令;基于运营意图调用至少一个AI服务,以生成与运营意图对应的运营操作序...
  • 本发明公开了基于远场语音的唤醒处理方法、装置、终端设备,涉及语音识别唤醒技术领域,包括:对检测到的唤醒音频进行分析处理,计算唤醒置信度评分;进行第一级判断:当计算出的唤醒音频的唤醒置信度评分大于或等于预设阈值,则确认此次唤醒有效并控制进入正...
  • 本发明涉及氛围灯控制技术领域,且公开了一种智能氛围灯的灯光音乐同步控制方法及音频优化系统,其中一种智能氛围灯的灯光音乐同步控制方法,包括利用收音模块对接收到的声音采用谱减法去噪与增强,并获取梅尔谱特征与声音能量。本发明通过收音模块接收声音,...
  • 本申请提供了一种基于大模型的气象信息语音交互处理方法,涉及人工智能、语音识别、自然语言处理和气象信息服务技术领域,包括:利用音频采集设备获取用户的语音信息,并通过语音识别技术将其转化为文本。系统依据预设的意图识别提示词库对文本进行解析,准确...
  • 本申请实施例提供了一种语音交互方法、系统及装置,涉及智能语音技术领域,其中,一种语音交互方法,包括:响应于目标语音设备识别到目标用户,指示目标图像采集单元针对所识别到的目标用户的行为路线进行监测,按照监测到的行为线路,控制目标语音设备的目标...
  • 本发明公开了一种设备唤醒方法、装置、设备、介质及计算机程序产品,所述方法包括:若多个待唤醒设备均接收到用户的唤醒音频,基于每个待唤醒设备接收到的唤醒音频,确定所述多个待唤醒设备中任意设备之间相对于所述用户的距离比、以及所述每个待唤醒设备相对...
  • 本发明公开了一种设备唤醒方法、装置、设备、介质及计算机程序产品,所述方法包括:若位于相同空间内的多个待唤醒设备均接收到用户的唤醒音频,确定每个待唤醒设备接收到的唤醒音频的能量值;若所述多个待唤醒设备中存在能量值之间的误差小于预设误差的多个第...
  • 本申请公开了一种基于多模态的语音触发控制系统和方法,包括:数据采集模块用于获取麦克风信号与柔性传感器信号并分别进行预处理;发声意图判断模块用于基于声学预处理信号和柔性预处理信号进行发声意图的判断;播放判断模块用于仅在预设时间间隔内接收到第一...
  • 本发明公开了一种基于虚幻引擎的车载数字人语音交互系统及方法。本发明包括语音采集模块:采用麦克风阵列,支持降噪处理;自然语言处理模块:集成经过微调的大语言模型,通过语音识别后的文本判断用户情感,输出情感标签和回答文本;流式语音合成模块:采用神...
  • 本申请提供了一种用于实现极速响应的流式asr构建方法及系统,包括获取情绪感知模型、并将所述情绪感知模型部署在声学模型内;获取表达习惯模型,并将所述表达习惯模型部署在语言模型内;获取上文输入,基于所述情绪感知模型、及所述表达习惯模型由所述上文...
  • 本申请涉及一种用户情感陪护式交互方法、装置和计算机设备。所述方法包括:通过多模态设备唤醒方式,获取用户的输入信息,并基于所述输入信息,通过用户语音识别策略,识别所述用户的当前语音内容;基于所述当前语音内容,通过解析理解策略,识别所述用户的语...
  • 本发明提出一种英语发音纠偏辅助系统,包括采集用户英语语音输入的麦克风、存储标准英语发音模型和用户发音历史数据的存储单元、对用户发音与标准发音进行实时比对分析的处理器、输出纠偏反馈信息的反馈单元;所述麦克风的输出端与所述处理器的输入端连接,所...
  • 本公开的一个或多个实施例提供一种语音识别模型的训练方法及相关设备,该语音识别模型的训练方法包括:获取多条场景种子数据;针对每条场景种子数据,利用语种识别模型对场景种子数据进行语种识别,确定场景种子数据的语种分布特征;根据多个场景种子数据对应...
  • 本申请属于大模型训练技术领域,提供一种基于语音对话掩码的多模态训练方法、设备、介质和程序产品,该方法包括,获取含多轮交互用户语音输入与AI回复文本的多模态训练数据;再从回复相关性、信息有效性及表达完整性维度,对每轮AI回复文本评分并输出具体...
技术分类