Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了基于语音的线性预测编解码器后处理方法、装置、设备及介质,涉及计算机技术领域,包括:获取通过标准线性预测编解码器处理原始语音信号得到的所有语音帧的原始解码参数;利用每种原始解码参数各自对应的预设参数增强模型对所述原始解码参数进行参...
  • 本发明提供一种实时通话翻译方法及装置,涉及数据处理技术领域,应用于蓝牙耳机,所述蓝牙耳机通过蓝牙免提协议与移动终端建立通信连接,并通过蓝牙低功耗通用属性协议与运行于所述移动终端的翻译应用建立通信连接;所述方法包括:获取待翻译原声,对所述待翻...
  • 本申请涉及一种音频传输控制方法、装置、设备及计算机存储介质,其方法包括分布式网络环境下构建主时钟、区域级边界时钟、末端透明时钟的多层级时钟源架构;结合动态路径延迟补偿机制和边缘节点协同校准策略以实现时间同步;基于DSP处理器获取多通道并行处...
  • 本发明公开了面向语音表征级的潜在敏感属性隐私保护方法和装置,装置包括:语音数据预处理模块,用于对输入的语音信号进行通道选择、数据填充及标准化处理;表征编码计算模块,用于从经预处理的语音信号中提取隐私保护的语音表征特征;身份效用计算模块,用于...
  • 本发明提供了一种宠物多模态需求识别系统及方法,包括采集宠物的声音信号;对声音信号进行特征提取,得到声音特征表示;将声音特征表示输入预训练的分类模型,得到各需求类型的概率分布;根据概率分布输出宠物需求类型。本发明能够提升宠物需求理解的准确性与...
  • 本发明涉及宠物智能硬件与生物声学识别技术领域,公开了一种基于狗声数据与情绪映射规则的宠物情绪识别方法和系统。该方法包括:获取公开狗声数据,经重采样、降噪、均衡等预处理;建立狗声标签与放松、焦虑、痛苦等情绪类别的动态映射规则,结合声学特征与置...
  • 本发明公开了一种利用卷积加长短时记忆网络的伪装语音检测方法,具体涉及信息安全技术领域,具体包括如下检测步骤:步骤一:构建端到端序列数据模型:通过对语音序列数据的计算输出其判定类别,并与真实类别构建其目标函数;步骤二:构建卷积加长短时记忆网络...
  • 本发明公开了一种医疗实时语音识别场景说话人识别方法,具体包括:利用网关层中的音频分流器对接收到PCM音频流执行并行分发,将音频流分别发送至自动语音识别链路和说话人分离链路;自动语音识别链路中,输出识别文本以及与识别文本中各最小语义单元对应的...
  • 本发明公开一种支持声纹识别的智能眼镜的身份验证方法、智能眼镜和存储介质,应用于智能眼镜,所述智能眼镜包括声纹识别模块,所述方法包括:通过所述声纹识别模块获取第一语音信号;所述第一语音信号对应目标声源;确定所述目标声源与所述声纹识别模块之间的...
  • 本申请公开了一种语音数据的缓存方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:确定目标区域中与智能设备存在交互的目标对象对应的对象标识,其中,对象标识与声纹特征存在对应关系;基于对象标识建立智能设备的语音数据缓存库,其中,...
  • 本发明公开了基于多尺度分解与混合重组的光纤分布式声纹识别方法,属于分布式光纤传感和人工智能技术领域,包括以下内容:构建DAS系统,利用DAS系统将后向瑞利散射光的相位及强度信号解调还原得到声纹信号;利用多尺度分解与混合重组网络将声纹信号转换...
  • 本申请涉及人工智能技术领域,公开了基于声纹识别的实时会议记录及字幕生成系统,包括:声纹识别引擎模块、离线语音转写模块、字幕生成与渲染模块以及本地数据库管理单元,所有模块均在本地设备运行。所述声纹识别引擎模块用于识别发言人身份,所述离线语音转...
  • 本发明涉及一种基于声纹识别的桥梁模数式伸缩缝弹性支承单元脱空检测方法及装置。通过拾音器阵列采集伸缩缝在车辆荷载下的运行声音信号;去噪和预加重预处理,引入Teager能量算子精确定位冲击峰值时刻;基于冲击时刻截取信号进行频谱分析,对比正常与脱...
  • 本发明提供一种多模态声纹识别方法及系统,包括:分别使用基于分块操作的PatchTST与ViT分别对声音信号数据的时域序列数据与频域图像数据进行分块特征提取;采用Bi‑Attention将同一时间帧的声纹时序特征与声纹频域特征进行融合,采用第...
  • 本发明实施例涉及语音识别领域,尤其公开了一种语音识别方法、装置、电子设备、存储介质及程序产品。该方法可包括:响应于待识别的目标语音,获取预先训练得到的语音识别模型及获取用于指示所需进行的语音识别任务的目标提示词;根据目标语音和目标提示词得到...
  • 本公开的实施例涉及用于处理语音转录文本的方法、装置、设备、介质和产品。该方法包括获取视频和与视频对应的第一语音转录文本。该方法还包括基于视频中的至少一个视频帧和第一语音转录文本,利用模型来确定针对第一语音转录文本中的错误内容的修改信息。该方...
  • 本发明提供的一种语音会议自动转写文字的方法及终端,包括:基于收集到的用户语音数据训练得到语音识别模型;实时输入语音会议,采用所述语音识别模型识别出所述语音会议中指定用户的声音,并转写为相应的初始文本;对所述初始文本进行预处理、关键信息提取和...
  • 本发明公开了一种智能门窗的多层语音识别控制方法,具体涉及语音识别技术领域,包括通过提取语音特征生成候选指令与原始置信度,并结合清晰度分析生成补偿值修正置信度,提升在噪声环境下语音指令的识别准确性与鲁棒性。基于补偿后置信度与阈值比较生成确认执...
  • 本发明公开了一种基于用户触控反馈的语音响应模型在线学习方法及装置,属于人工智能与人机交互技术领域,所述方法为:实时采集用户的语音信号,并提取语音信号的声学特征序列;将声学特征序列输入至语音响应模型进行响应时机判断,输出响应触发概率值;同步采...
  • 本申请适用于智能终端技术领域,提供了一种设备唤醒方法及语音控制系统,包括:获取预设唤醒范围内的第t次唤醒过程对应的第一数据集;其中,所述第一数据集包括所述预设唤醒范围内的多个设备各自的第一能量值;根据所述第一数据集确定所述多个设备各自的能量...
技术分类