Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及人工智能技术领域,公开了一种面审视频数据的违规提示检测方法、装置、设备及介质,包括:同步分离面审视频的音频流与视频流;对音频流进行语音活动检测得到有效语音段集合,同时对视频流进行唇部运动分析得到用户说话状态的时段集合;将两者时间对...
  • 本申请涉及说话人转换点检测的技术领域,尤其涉及一种流式说话人转换点检测方法、装置、设备及存储介质。包括:提取目标语音片段中的当前语音子片段并获取对应的历史标签序列;对当前语音子片段进行特征提取以得到当前片段特征,将当前片段特征与历史标签序列...
  • 本说明书一个或多个实施例提供了一种声纹注册方法、声纹识别方法及相关装置,在声纹注册过程中,不仅获取表示待注册用户的声音特征的声纹信息,还基于待注册用户的用户信息生成伪随机数序列,作为该待注册用户的标识序列,并将该标识序列嵌入该待注册用户的声...
  • 本申请涉及语音关键词检测的技术领域,尤其涉及一种帧异步双通路关键词检测方法、装置、设备及存储介质。包括:提取原始音频波形的声学特征序列;对声学特征序列进行注意力引导,生成偏置声学特征序列;确定验证激活阈值及当前跳帧上限;基于当前跳帧上限对偏...
  • 本发明属于计算机技术领域,提供了一种基于机器学习的全过程工程咨询方法及系统,所述方法包括以下步骤:用户端发起咨询请求时,通过麦克风设备获取输入咨询语音并转化为电学信号,将电学信号通过短时傅里叶变换定位分段点,基于分段点将电学信号划分为多个信...
  • 本申请公开了一种语音识别方法及装置。其中,该方法包括:接收待识别语音数据;采用预设模型对待识别语音数据进行识别,得到文本数据,其中,预设模型中至少包括:编码器和解码器,编码器中包括多个编码器模块,编码器模块中至少包括:动态稀疏注意力模块,动...
  • 本申请实施例提供了一种语音识别方法、装置、设备和存储介质,获取待识别语音;将待识别语音输入预训练的语音识别模型;在前序模块处理待识别语音得到中间信息后,将中间信息输入语音识别模块得到候选分词对应的语音识别分数,以及,将中间信息输入语种分类模...
  • 本申请公开了一种语音识别方法和装置、存储介质及电子设备。涉及金融科技领域,该方法包括:获取待处理的目标语音数据,其中,目标语音数据是非标准发音的语音数据;采用目标语音识别模型对目标语音数据进行语音识别,得到目标语音数据对应的第一文本数据,其...
  • 本发明公开了一种基于大模型意图识别与安全协议执行的手机指令控制系统及方法,通过对用户语音指令进行采集与语音识别后,将获得的文本指令发送至云端大模型,在提示约束模板的限定下完成操作指令与非操作内容的区分,并在判定为操作指令时输出包含意图标识与...
  • 本发明属于设备控制技术领域,具体为基于AI视觉与行为预测的穿戴设备控制方法及系统,包括:获取智能穿戴设备数据并进行预处理;对多模态特征集分配伪名称标识,并构建感知数据与行为意图的时序因果链;根据意图概率分布生成轻量化模型,事件驱动预生成语音...
  • 本发明涉及人工智能技术领域,具体地说,涉及一种医疗语音控制方法,其包括如下步骤:采用高保真麦克风在手术室、ICU场景,采集医生指令、患者需求及设备反馈语音,通过短时能量法去除背景噪声,通过卷积循环神经网络结合注意力机制强化语音主频段识别,通...
  • 本发明公开了基于AI边缘算法的多媒体终端、终端控制方法及设备,本发明通过在终端本地集成包含神经处理单元与轻量化AI模型库的边缘计算模块,并结合前端语音降噪处理,实现了语音指令的本地化高速识别与理解。主控模块协调各模块协同工作,确保从采集、处...
  • 本申请公开了一种操作指令的转换方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:确定目标语音指令对应的指令类型,指令类型至少包括以下之一:多模态交互指令、多语种混合指令、隐喻指令、多设备状态指令、非连贯指令、包含操作视频的语...
  • 本发明提供了一种智能座舱意图识别方法、系统、电子设备及介质,属于智能座舱技术领域,该方法包括:构建智能座舱意图识别数据集;基于智能座舱意图识别数据集训练初始大语言模型,得到目标大语言模型;在接收到用户指令时,将用户指令输入目标大语言模型;对...
  • 本发明提供了一种智能座舱语音唤醒方法、系统、设备及介质,属于智能座舱技术领域,该方法包括:获取原始语音信号及环境噪声,并从所述原始语音信号中分离所述环境噪声,得到目标语音信号;提取所述目标语音信号中的实时特征,并基于所述实时特征更新声纹模版...
  • 本发明提供一种基于信息融合车载多媒体NLU意图判断方法及系统,本方法首先融合用户语音指令与车辆动态、用户记忆、大数据等多维度情境信息,生成候选意图概率分布。基于车载运行状态动态确定信息熵阈值,通过比较分布信息熵判断用户意图是否模糊。若模糊,...
  • 本申请公开了一种语音交互方法、装置、存储介质及电子装置,涉及语音识别技术领域,该语音交互方法包括:获取待识别语音的方言切换特征和置信度评估特征;根据方言切换特征和置信度评估特征,获取待识别语音的拒识判断结果;根据拒识判断结果,对待识别语音进...
  • 本发明涉及智能穿戴交互技术领域,公开了一种基于物联网的智能手环对话交互方法、设备及介质。该方法通过语音传感器采集历史对话数据流,提取每个对话片段的语音特征向量及语义特征向量;根据多时段语音特征向量的波动范围划分对话模式为稳态对话模式和动态对...
  • 一种混合语言标识(HLI)系统包括:一个或多个麦克风,被配置成检测主机系统的内部内的声学话语;扬声器,可操作用于在主机系统的内部内广播提示或响应;处理器和存储器。处理器执行一种方法,所述方法:使用存储在存储器中的混合语言检测逻辑将声音话语分...
  • 提供了音频管理方法、计算设备、音频系统和介质。音频管理方法由计算设备执行,并且可以包括:经由与环境中的一个或多个音频设备的通信连接,向所述一个或多个音频设备发送启动指令,以启动所述一个或多个音频设备包括的麦克风捕获音频数据;经由所述通信连接...
技术分类