Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供了一种车辆的语音处理方法、车辆及计算机可读存储介质,涉及车辆技术、语音处理技术领域,该方法包括:监测车辆的座位乘坐状态,得到监测结果,其中,监测结果用于反映车辆中任一座位上是否有乘坐对象;响应于车辆中第一座位上无乘坐对象,基...
  • 本公开提供了一种语音识别方法,所述方法应用于计算装置内,所述计算装置包括:DMA单元和运算单元;所述方法包括如下步骤:通过DMA单元获取用户输入的待识别语音;运算单元调用运算指令对所述待识别语音进行语音识别处理,从而获得所述待识别语音所对应...
  • 本申请公开一种基于大模型的变量提取方法及相关设备,包括:云端接收机器人上传的录音数据以生成待处理录音数据;将待处理录音数据输入语言大模型获取第一文字信息,语言大模型被配置为:对待处理录音数据进行句子拆分得到多个音频数据,对待处理录音数据进行...
  • 本发明提供了一种基于多模态输入的语音生成方法及相关设备,方法包括接收多模态输入数据及辅助输入数据并输入多模态数据管理器进行融合处理及提取关联特征得到多模态融合特征;将多模态融合特征输入上下文状态建模器、状态和行为控制器、语音生成策略引擎、平...
  • 本申请公开了一种音频信号处理装置、方法、设备、介质及产品。上述装置包括:存储模块、数字信号处理器DSP芯片和人工智能AI芯片;DSP芯片,被配置为接收音频信号;执行对音频信号的预处理,得到第一音频数据;向AI芯片发送控制指令,控制指令用于控...
  • 本发明涉及人工智能技术领域,可应用于金融科技和医疗健康领域,公开了一种基于声纹识别的反欺诈方法、装置、设备及介质,方法包括:获取通话语音信号,并对所述通话语音信号进行处理得到多维度声纹特征;将所述多维度声纹特征输入深度学习模型中进行优化得到...
  • 本公开提供一种说话人识别的方法及装置、电子设备和存储介质,该说话人识别的方法包括:获取第一通信记录;根据第一通信记录,确定第一视频会议的候选参会人员集合,该候选参会人员集合包括多个候选参会人员;根据第一视频会议的音频数据和候选参会人员集合中...
  • 本公开实施例提供了一种语音处理方法、装置、电子设备以及存储介质。该方法包括:确定待处理语音信息对应的待处理语音特征信息,所述待处理语音特征信息是通过对目标语音识别模型的编码器从所述待处理语音信息中提取的语音特征信息所包括的冗余音色特征信息进...
  • 本公开是关于一种音频处理方法、音频处理装置、电子设备及存储介质。音频处理方法包括:获取待处理音频,并获取对应于所述待处理音频的第一后验概率结果,所述第一后验概率结果包括所述待处理音频中每个时间节点的后验概率,所述每个时间节点的后验概率包括多...
  • 本发明涉及语音识别技术领域,具体公开了一种基于NFC的智能眼镜声纹防伪识别方法及系统。该系统集成于智能眼镜,包括声纹采集与处理模块、近场通信安全传输模块及云端声纹认证服务器,通过活体语音检测、动态声纹特征提取和近场加密传输,结合动态会话密钥...
  • 本申请提供了一种基于低功耗唤醒协议的多级唤醒方法、系统、介质及产品,涉及智能语音识别技术领域,该方法包括:利用接收到的外部触发信号触发第一级唤醒码广播模块通过目标低功耗唤醒协议广播目标唤醒信号;获取待唤醒设备对接收到的目标唤醒信号进行有效性...
  • 本申请公开了一种唤醒设备的确定方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该唤醒设备的确定方法包括:对接收到的目标对象的语音数据进行解析,确定出语音数据包含的唤醒指令;针对位于预设唤醒范围内的所有待唤醒设备,对所有待唤醒设备进行分...
  • 本发明提供了一种南美白对虾行为状态声学智能识别方法及模型搭建方法,属于水产养殖声学监测技术领域;包括以下步骤:获取南美白对虾不同行为状态下的音频数据;对音频进行滤波分帧、门限检测及特征提取,构建规范化的音频特征数据集;搭建一种融合注意力统计...
  • 本发明涉及人工智能技术领域,可应用于金融科技和医疗科技领域,公开了一种语音编解码方法、装置、设备及介质,该方法包括:获取原始语音信号并提取原始语音频谱特征;通过第一阶段镜像架构训练的编码器对其编码得到连续向量;将连续向量分割为子向量,经量化...
  • 本发明公开一种基于双分辨率码本的子带清浊音参数量化方法及系统。所述方法包括:基于语音训练集构建清浊音参数量化一级码本,并通过分析一级码字对应的胞腔矢量频次,构建局部高分辨率的二级码本;同时统计前后帧清浊音模式之间的转移关系,生成似然矩阵;在...
  • 本发明所提供的面向边缘设备的轻量化语音频带拓展方法、装置、终端及介质,属于语音信号处理技术领域,所述方法包括:得到对数域窄带音频信号幅度谱和对数域混合幅度谱;构建白噪声幅度谱;将对数域窄带音频信号幅度谱、对数域混合幅度谱和白噪声幅度谱输入至...
  • 本申请公开了基于神经网络的线谱频率增强方法、装置、设备及介质,涉及音频处理技术领域,包括:获取各语音帧分别对应的各目标语音特征参数;确定当前语音帧的第一线谱频率与历史语音帧的第二线谱频率之间的余弦相似度,并确定当前语音帧与历史语音帧间的频域...
  • 本发明公开了一种基于安卓系统的音频流动态捕获与编码传输方法及装置,涉及音频传输技术领域。所述方法包括:以后台服务的形式自动运行程序,向安卓系统发起音频焦点请求;被安卓系统授予音频焦点后,将音频流输出设备从内置扬声器切换至由程序创建的虚拟设备...
  • 本申请公开了一种音频信号处理方法、装置、设备及存储介质,涉及信号处理技术领域,包括:获取输入的目标音频信号,并检测目标音频信号是否为语音;若目标音频信号为语音,则基于预设频率范围确定目标音频信号中的第一信号,并利用预设语音声码器基于第一信号...
  • 本公开的实施例提供了音频信号处理方法、设备以及计算机可读存储介质。所述音频信号处理方法,包括:对当前帧音频信号进行频域分析,以确定所述当前帧音频信号中存在幅值异常的第一频率窗口,以及中心频率接近所述第一频率窗口且不存在幅值异常的至少一个第二...
技术分类