Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种音频处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:通过目标对象标识发起音频交互后,启动音频信号采集;计算实时采集的音频信号对应的声纹向量,将计算得到的声纹向量与目标对象标识对应的目标声纹向量进行...
  • 本申请公开了一种音频水印嵌入方法、音频水印提取方法和模型训练方法,属于人工智能技术领域。该音频水印嵌入方法包括:获取水印数据和原始音频数据中需要嵌入水印的原始音频片段;将原始音频片段和水印数据输入编码器,通过编码器确定原始音频片段中至少两个...
  • 本发明涉及语音处理技术领域,可应用于金融科技和医疗健康领域,公开了一种语音数据处理方法、装置、设备及介质,方法包括:获取原始语音数据,对所述原始语音数据依次进行版权检测、标准化处理以及水印检测得到处理语音数据;对所述处理语音数据进行人声分离...
  • 本发明公开了一种基于音频能量的音频数据处理方法,通过获取预设位宽音频数据的音频参数;判断预设位宽音频数据的音频参数是否小于或等于预设能量比较阈值;判断出音频数据的数据类型,并根据数据类型对数据进行压缩或裁剪处理后形成较小的音频数据,再进行传...
  • 本发明公开了一种音频解码抗抖动方法、装置、电子设备、存储介质和程序,其中,该方法包括:确定待解码的音频数据的接收稳定性指标以及音频缓冲指标;根据所述接收稳定性指标和所述音频缓冲指标确定音频采样率的调整方式;按照所述调整方式对解码后的所述音频...
  • 一种装置,包括用于以下的部件:从一个或多个所捕获的图像的图像分析中获取基于图像的声源位置数据;将多麦克风音频编码为包括空间音频元数据参数的元数据辅助空间音频;将基于图像的声源位置数据编码在元数据辅助空间音频的一个或多个空间音频元数据参数内,...
  • 本发明提供一种基于声纹一致性验证的语音提取方法及其相关设备,包括:确定目标语音数据;加载目标语音者的质心数据,并对所述目标语音数据进行一致性验证处理,得到验证声纹数据;通过预设分离网络,对所述验证声纹数据进行分离处理,得到目标声纹数据;对所...
  • 本发明公开了一种声纹识别模型的训练方法、装置及可读介质,包括:响应于确定在声纹识别模型的训练过程中所使用的损失函数为AMSoftmax或AAMSoftmax;对AMSoftmax或AAMSoftmax中的用于控制收敛程度的超参数m进行初始化...
  • 本发明涉及拾音识别技术领域,具体涉及基于声纹表征记忆的拾音识别方法及系统,该系统与方法通过通用声纹表征提取序列与动态声音特征提取序列的设置,在进行声纹表征记忆的拾音识别过程中,两者结合既避免了传统技术“全特征一次性提取”的资源浪费,又克服了...
  • 本发明公开了基于时空自注意力的音频指纹识别系统,涉及音频信息处理技术领域,具体包括以下模块:音频预处理模块、时空分解模块、特征提取模块、特征融合模块、时空重构模块以及指纹识别模块;本发明通过音频预处理模块对待识别音频数据进行预处理;时空分解...
  • 本申请涉及一种融合语境知识的空管语音识别文本纠错方法及装置。所述方法包括:获取历史空管语音通话数据并进行预处理,得到对齐后多个候选文本序列,建立包含动态呼号集合和静态指令参数库的语境信息;构建融合语境知识的空管语音识别文本纠错模型;将对齐后...
  • 本发明提供一种基于动态缓存分配的AI语音设备推理优化方法及其相关设备,包括:获取语音输入序列,并对所述语音输入序列进行切分,得到多个注意力对象数据;基于预设注意力矩阵和预设注意力阈值,生成注意力稀疏化索引;基于所述注意力稀疏化索引,从所述多...
  • 本发明公开了一种自适应流式语音转录优化方法、装置、电子设备及产品,涉及语音转录技术领域。将实时音频数据流输入流式语音识别模型,得到初始文本流;当从实时音频数据流中检测出一个完整语音片段时,将最新检测出的完整语音片段以及初始文本流中与完整语音...
  • 本发明涉及智能外呼技术领域,一种基于语音识别与语言理解的智能外呼交互方法及系统,包括:基于任务分配指令获取目标外呼任务及话术模版集,确认利用目标号码获取用户的初始语音信号后,对初始语音信号进行降噪及特征提取得到降噪语音信号特征集,利用自动语...
  • 本发明公开了一种基于边缘智能的多语言拟人语音转述社交装置及其异步交互方法,适用于儿童、老年人、情侣等用户群体的跨语言情感交流。所述装置包括语音采集模块、边缘智能识别模块、通信模块和拟人语音输出模块,支持本地语音识别与确认后上传。云端平台完成...
  • 本发明提供一种语音交互方法、装置及电子设备,涉及语音处理技术领域,其中方法包括:获取用户输入的语音信息,并获取用户的历史意图文本;将所述语音信息输入至口语理解模型的语音编码器,得到所述语音编码器输出的声学编码特征;将所述历史意图文本输入至所...
  • 本发明公开了一种人形机器人全身协同语音控制系统及方法,涉及机器人技术领域,针对现有人形机器人语音控制中存在语义理解浅层化、动作规划局部化及安全控制滞后化的问题,本发明通过多模态意图理解模块、全身动作规划模块、动态平衡安全仲裁器和微内核安全调...
  • 本发明涉及语音识别技术领域,尤其涉及一种智能门窗多智能控制切换方法及系统,方法包括:获取混合声音信号和模板声音信号,对混合声音信号进行分解和切分,得到多个源信号及源信号帧,在各源信号帧中,确定各频率作为目标频率时的谐波集合和次谐波集合,计算...
  • 本发明公开了一种语音助手交互方法以及系统,包括端侧设备层、云端服务层及通信交互层,所述端侧设备层包括至少两种终端设备,各终端设备配置多模态传感器。本发明通过多模态数据融合补偿单模态噪声干扰,显著优于现有语音助手;基于意图、情绪和设备的三元组...
  • 本申请涉及数字人领域,具体涉及一种基于AI数字人的智能汽车管家系统。其采用基于深度学习的人工智能技术对用户输入的咨询语音进行语音识别和细粒度语义编码,从中提取出语音识别结果的上下文语义特征,同时结合用户输入的文本描述补充,通过对用户咨询的语...
技术分类