Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种语音识别方法及装置。其中,该方法包括:接收待识别语音数据;采用预设模型对待识别语音数据进行识别,得到文本数据,其中,预设模型中至少包括:编码器和解码器,编码器中包括多个编码器模块,编码器模块中至少包括:动态稀疏注意力模块,动...
  • 本申请实施例提供了一种语音识别方法、装置、设备和存储介质,获取待识别语音;将待识别语音输入预训练的语音识别模型;在前序模块处理待识别语音得到中间信息后,将中间信息输入语音识别模块得到候选分词对应的语音识别分数,以及,将中间信息输入语种分类模...
  • 本申请公开了一种语音识别方法和装置、存储介质及电子设备。涉及金融科技领域,该方法包括:获取待处理的目标语音数据,其中,目标语音数据是非标准发音的语音数据;采用目标语音识别模型对目标语音数据进行语音识别,得到目标语音数据对应的第一文本数据,其...
  • 本发明公开了一种基于大模型意图识别与安全协议执行的手机指令控制系统及方法,通过对用户语音指令进行采集与语音识别后,将获得的文本指令发送至云端大模型,在提示约束模板的限定下完成操作指令与非操作内容的区分,并在判定为操作指令时输出包含意图标识与...
  • 本发明属于设备控制技术领域,具体为基于AI视觉与行为预测的穿戴设备控制方法及系统,包括:获取智能穿戴设备数据并进行预处理;对多模态特征集分配伪名称标识,并构建感知数据与行为意图的时序因果链;根据意图概率分布生成轻量化模型,事件驱动预生成语音...
  • 本发明涉及人工智能技术领域,具体地说,涉及一种医疗语音控制方法,其包括如下步骤:采用高保真麦克风在手术室、ICU场景,采集医生指令、患者需求及设备反馈语音,通过短时能量法去除背景噪声,通过卷积循环神经网络结合注意力机制强化语音主频段识别,通...
  • 本发明公开了基于AI边缘算法的多媒体终端、终端控制方法及设备,本发明通过在终端本地集成包含神经处理单元与轻量化AI模型库的边缘计算模块,并结合前端语音降噪处理,实现了语音指令的本地化高速识别与理解。主控模块协调各模块协同工作,确保从采集、处...
  • 本申请公开了一种操作指令的转换方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:确定目标语音指令对应的指令类型,指令类型至少包括以下之一:多模态交互指令、多语种混合指令、隐喻指令、多设备状态指令、非连贯指令、包含操作视频的语...
  • 本发明提供了一种智能座舱意图识别方法、系统、电子设备及介质,属于智能座舱技术领域,该方法包括:构建智能座舱意图识别数据集;基于智能座舱意图识别数据集训练初始大语言模型,得到目标大语言模型;在接收到用户指令时,将用户指令输入目标大语言模型;对...
  • 本发明提供了一种智能座舱语音唤醒方法、系统、设备及介质,属于智能座舱技术领域,该方法包括:获取原始语音信号及环境噪声,并从所述原始语音信号中分离所述环境噪声,得到目标语音信号;提取所述目标语音信号中的实时特征,并基于所述实时特征更新声纹模版...
  • 本发明提供一种基于信息融合车载多媒体NLU意图判断方法及系统,本方法首先融合用户语音指令与车辆动态、用户记忆、大数据等多维度情境信息,生成候选意图概率分布。基于车载运行状态动态确定信息熵阈值,通过比较分布信息熵判断用户意图是否模糊。若模糊,...
  • 本申请公开了一种语音交互方法、装置、存储介质及电子装置,涉及语音识别技术领域,该语音交互方法包括:获取待识别语音的方言切换特征和置信度评估特征;根据方言切换特征和置信度评估特征,获取待识别语音的拒识判断结果;根据拒识判断结果,对待识别语音进...
  • 本发明涉及智能穿戴交互技术领域,公开了一种基于物联网的智能手环对话交互方法、设备及介质。该方法通过语音传感器采集历史对话数据流,提取每个对话片段的语音特征向量及语义特征向量;根据多时段语音特征向量的波动范围划分对话模式为稳态对话模式和动态对...
  • 一种混合语言标识(HLI)系统包括:一个或多个麦克风,被配置成检测主机系统的内部内的声学话语;扬声器,可操作用于在主机系统的内部内广播提示或响应;处理器和存储器。处理器执行一种方法,所述方法:使用存储在存储器中的混合语言检测逻辑将声音话语分...
  • 提供了音频管理方法、计算设备、音频系统和介质。音频管理方法由计算设备执行,并且可以包括:经由与环境中的一个或多个音频设备的通信连接,向所述一个或多个音频设备发送启动指令,以启动所述一个或多个音频设备包括的麦克风捕获音频数据;经由所述通信连接...
  • 本发明公开了一种语音检测方法、装置、设备、介质以及产品。该方法包括:识别交互语音中的语音文本信息;确定语音文本信息中的唤醒词,以及与唤醒词相关联的预唤醒文本;根据预唤醒文本的属性信息确定车辆交互设备的唤醒响应情况。本发明通过识别交互语音中的...
  • 本公开实施例提供一种摄像单元的语音唤醒方法、装置、电子设备及存储介质,通过接收交互设备发送的第一用户语音,并根据第一用户语音,得到对应的语音特征数据,语音特征数据表征第一用户语音的语音内容;通过大语言模型处理语音特征数据,生成第一执行指令,...
  • 本发明提供了一种用于车辆的生成式AI处理方法和系统,方法包括:在该车辆与移动设备之间建立连接;响应于触发车载语音助手,接收来自用户的语音输入;以及将该语音输入送入该移动设备处内置的AI模型以得到AI生成的结果。另外,本发明还提供了一种支持生...
  • 本公开的实施例提供了用于交互控制的方法、装置、设备、介质和程序产品。该方法包括:从与终端设备连接的可穿戴设备接收用户的语音信息;响应于接收到语音信息,至少基于终端设备处的当前交互状态,确定在终端设备处要执行的目标功能;至少基于语音信息来执行...
  • 本公开的实施例提供了用于交互控制的方法、装置、设备、介质和程序产品。该方法包括:由可穿戴设备采集用户的语音信息,可穿戴设备被连接到多个终端设备;基于多个终端设备的活跃状态、优先级以及与可穿戴设备之间的通信连接的有效性中的至少一项,从多个终端...
技术分类