Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例提供了一种语音识别方法、装置、设备和存储介质,获取待识别语音;将待识别语音输入预训练的语音识别模型;在前序模块处理待识别语音得到中间信息后,将中间信息输入语音识别模块得到候选分词对应的语音识别分数,以及,将中间信息输入语种分类模...
  • 本申请公开了一种语音识别方法及装置。其中,该方法包括:接收待识别语音数据;采用预设模型对待识别语音数据进行识别,得到文本数据,其中,预设模型中至少包括:编码器和解码器,编码器中包括多个编码器模块,编码器模块中至少包括:动态稀疏注意力模块,动...
  • 本发明属于计算机技术领域,提供了一种基于机器学习的全过程工程咨询方法及系统,所述方法包括以下步骤:用户端发起咨询请求时,通过麦克风设备获取输入咨询语音并转化为电学信号,将电学信号通过短时傅里叶变换定位分段点,基于分段点将电学信号划分为多个信...
  • 本申请涉及语音关键词检测的技术领域,尤其涉及一种帧异步双通路关键词检测方法、装置、设备及存储介质。包括:提取原始音频波形的声学特征序列;对声学特征序列进行注意力引导,生成偏置声学特征序列;确定验证激活阈值及当前跳帧上限;基于当前跳帧上限对偏...
  • 本说明书一个或多个实施例提供了一种声纹注册方法、声纹识别方法及相关装置,在声纹注册过程中,不仅获取表示待注册用户的声音特征的声纹信息,还基于待注册用户的用户信息生成伪随机数序列,作为该待注册用户的标识序列,并将该标识序列嵌入该待注册用户的声...
  • 本申请涉及说话人转换点检测的技术领域,尤其涉及一种流式说话人转换点检测方法、装置、设备及存储介质。包括:提取目标语音片段中的当前语音子片段并获取对应的历史标签序列;对当前语音子片段进行特征提取以得到当前片段特征,将当前片段特征与历史标签序列...
  • 本申请涉及人工智能技术领域,公开了一种面审视频数据的违规提示检测方法、装置、设备及介质,包括:同步分离面审视频的音频流与视频流;对音频流进行语音活动检测得到有效语音段集合,同时对视频流进行唇部运动分析得到用户说话状态的时段集合;将两者时间对...
  • 本发明公开了多模态融合的声纹识别模型训练方法及系统,涉及工业自动化控制与生物特征识别技术领域。包括:获取操作人员语音指令数据;下发操作指令触发调取设备历史状态日志及测量数据;基于日志设置性能阈值范围,与时间窗内设备状态变化量匹配——当状态变...
  • 本申请公开了一种混合编码数据流解码方法及相关装置,涉及人工智能技术领域,本申请方案当接收端遇到编码未知的混合编码数据流时,利用大语言模型强大的模式识别与语义理解能力,自动解析出混合编码数据流对应的解码逻辑规则, 基于所述混合编码数据流对应的...
  • 本公开的实施例提供了一种用于语音合成的方法、装置、设备和可读存储介质。在本公开的实施例中,获取与目标文本对应的初始声学特征。在声码器模型包括的残差网络中,利用残差网络对初始声学特征执行卷积操作,以得到与残差网络中的多个扩张卷积层各自对应的多...
  • 本发明公开一种基于动态降噪链及反馈优化的降噪方法及系统,方法包括:获取原始语音数据;构建场景识别模型,对原始语音数据进行多尺度特征提取得到语音特征数据,通过多通道建模分析及特征融合,得到融合特征数据,基于融合特征数据得到场景概率分布,进而得...
  • 本申请涉及一种组合电器的击穿声学信号的去噪方法、装置、设备、存储介质。方法包括:采集受环境噪声污染的组合电器击穿声学信号并建模为原始无噪声击穿信号与噪声信号叠加的带噪信号;将带噪信号划分为连续重叠的信号帧,对各帧施加窗函数后执行快速傅里叶变...
  • 本申请公开了一种变电站噪声智能分离方法、装置、设备及介质,涉及音频处理领域,包括:采集若干目标设备工作时产生的设备噪声,并对设备噪声预处理,以基于得到的预处理后噪声数据构建目标混合噪声数据集;对原始音频信号进行混合,并对得到的混合音频信号分...
  • 本申请提供了一种数据处理方法、装置、设备、介质及产品,该方法包括:获取业务场景中采集到的多模态数据,该多模态数据包括音频数据和视觉数据;音频数据包含对业务场景中的N个对象进行音频信号采集得到的多声源音频信号,视觉数据包含在采集多声源音频信号...
  • 本申请公开了一种车载屏综合监测系统及方法,涉及屏幕测试技术领域。其中车载屏综合监测系统,包括:声音监测模块,用于获取车载屏被操作时所产生的声音;视频监测模块,用于获取车载屏被操作时的操作动作和屏幕响应;数据分析模块,被配置为:从声音监测模块...
  • 本申请涉及一种基于声音与温度融合感知的烹饪状态识别方法及系统,通过获取并处理包含锅具特征声音的混合音频信号,实现了对烹饪过程伴生声学信息的有效捕获与特征化表征;通过获取锅具底部的实时温度数据,实现了对烹饪核心热力状态的直接量化监测;进而,通...
  • 本发明涉及变压器故障诊断技术领域,尤其是一种基于生成式声学大模型增强的变压器故障诊断方法及系统,该方法包括:构建生成式声学大模型,利用声学语义提示符生成指定虚拟基准梅尔频谱特征数据,配置条件自编码模型基于诊断条件标签以及当前的基准梅尔频谱特...
  • 本发明提供一种基于双重交互查询的语音反欺骗方法和系统,涉及语音识别技术领域。本发明针对现有技术无法很好的兼顾深度伪造语音检测的性能与效率这一技术问题,提出了基于双重交互查询的音频理解模型。该模型利用基于交叉注意力的双分支处理模块中的局部模式...
  • 本发明涉及煤矿智能监测与故障诊断技术领域,尤其涉及基于声音阵列与时空特征网络的刮板机断联识别监测方法,包括:布设8×n防爆麦克风阵列采集全链条声学信号;构建含正常及多种故障工况的标注数据集;通过自适应谱减与改进波束形成进行多通道去噪与聚焦;...
  • 本申请实施例涉及语音处理技术领域,公开了一种口语发音评测方法、模型的训练方法及电子设备,口语发音评测方法包括:获取用户朗读音频和对应的文本;根据文本对用户朗读音频进行分数评估,以得到原始评测分数;提取用户朗读音频的音频特征,并对音频特征进行...
技术分类