Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种基于声音与温度融合感知的烹饪状态识别方法及系统,通过获取并处理包含锅具特征声音的混合音频信号,实现了对烹饪过程伴生声学信息的有效捕获与特征化表征;通过获取锅具底部的实时温度数据,实现了对烹饪核心热力状态的直接量化监测;进而,通...
  • 本申请公开了一种车载屏综合监测系统及方法,涉及屏幕测试技术领域。其中车载屏综合监测系统,包括:声音监测模块,用于获取车载屏被操作时所产生的声音;视频监测模块,用于获取车载屏被操作时的操作动作和屏幕响应;数据分析模块,被配置为:从声音监测模块...
  • 本申请提供了一种数据处理方法、装置、设备、介质及产品,该方法包括:获取业务场景中采集到的多模态数据,该多模态数据包括音频数据和视觉数据;音频数据包含对业务场景中的N个对象进行音频信号采集得到的多声源音频信号,视觉数据包含在采集多声源音频信号...
  • 本申请公开了一种变电站噪声智能分离方法、装置、设备及介质,涉及音频处理领域,包括:采集若干目标设备工作时产生的设备噪声,并对设备噪声预处理,以基于得到的预处理后噪声数据构建目标混合噪声数据集;对原始音频信号进行混合,并对得到的混合音频信号分...
  • 本申请涉及一种组合电器的击穿声学信号的去噪方法、装置、设备、存储介质。方法包括:采集受环境噪声污染的组合电器击穿声学信号并建模为原始无噪声击穿信号与噪声信号叠加的带噪信号;将带噪信号划分为连续重叠的信号帧,对各帧施加窗函数后执行快速傅里叶变...
  • 本发明公开一种基于动态降噪链及反馈优化的降噪方法及系统,方法包括:获取原始语音数据;构建场景识别模型,对原始语音数据进行多尺度特征提取得到语音特征数据,通过多通道建模分析及特征融合,得到融合特征数据,基于融合特征数据得到场景概率分布,进而得...
  • 本公开的实施例提供了一种用于语音合成的方法、装置、设备和可读存储介质。在本公开的实施例中,获取与目标文本对应的初始声学特征。在声码器模型包括的残差网络中,利用残差网络对初始声学特征执行卷积操作,以得到与残差网络中的多个扩张卷积层各自对应的多...
  • 本申请公开了一种混合编码数据流解码方法及相关装置,涉及人工智能技术领域,本申请方案当接收端遇到编码未知的混合编码数据流时,利用大语言模型强大的模式识别与语义理解能力,自动解析出混合编码数据流对应的解码逻辑规则, 基于所述混合编码数据流对应的...
  • 本发明公开了多模态融合的声纹识别模型训练方法及系统,涉及工业自动化控制与生物特征识别技术领域。包括:获取操作人员语音指令数据;下发操作指令触发调取设备历史状态日志及测量数据;基于日志设置性能阈值范围,与时间窗内设备状态变化量匹配——当状态变...
  • 本申请涉及人工智能技术领域,公开了一种面审视频数据的违规提示检测方法、装置、设备及介质,包括:同步分离面审视频的音频流与视频流;对音频流进行语音活动检测得到有效语音段集合,同时对视频流进行唇部运动分析得到用户说话状态的时段集合;将两者时间对...
  • 本申请涉及说话人转换点检测的技术领域,尤其涉及一种流式说话人转换点检测方法、装置、设备及存储介质。包括:提取目标语音片段中的当前语音子片段并获取对应的历史标签序列;对当前语音子片段进行特征提取以得到当前片段特征,将当前片段特征与历史标签序列...
  • 本说明书一个或多个实施例提供了一种声纹注册方法、声纹识别方法及相关装置,在声纹注册过程中,不仅获取表示待注册用户的声音特征的声纹信息,还基于待注册用户的用户信息生成伪随机数序列,作为该待注册用户的标识序列,并将该标识序列嵌入该待注册用户的声...
  • 本申请涉及语音关键词检测的技术领域,尤其涉及一种帧异步双通路关键词检测方法、装置、设备及存储介质。包括:提取原始音频波形的声学特征序列;对声学特征序列进行注意力引导,生成偏置声学特征序列;确定验证激活阈值及当前跳帧上限;基于当前跳帧上限对偏...
  • 本发明属于计算机技术领域,提供了一种基于机器学习的全过程工程咨询方法及系统,所述方法包括以下步骤:用户端发起咨询请求时,通过麦克风设备获取输入咨询语音并转化为电学信号,将电学信号通过短时傅里叶变换定位分段点,基于分段点将电学信号划分为多个信...
  • 本申请公开了一种语音识别方法及装置。其中,该方法包括:接收待识别语音数据;采用预设模型对待识别语音数据进行识别,得到文本数据,其中,预设模型中至少包括:编码器和解码器,编码器中包括多个编码器模块,编码器模块中至少包括:动态稀疏注意力模块,动...
  • 本申请实施例提供了一种语音识别方法、装置、设备和存储介质,获取待识别语音;将待识别语音输入预训练的语音识别模型;在前序模块处理待识别语音得到中间信息后,将中间信息输入语音识别模块得到候选分词对应的语音识别分数,以及,将中间信息输入语种分类模...
  • 本申请公开了一种语音识别方法和装置、存储介质及电子设备。涉及金融科技领域,该方法包括:获取待处理的目标语音数据,其中,目标语音数据是非标准发音的语音数据;采用目标语音识别模型对目标语音数据进行语音识别,得到目标语音数据对应的第一文本数据,其...
  • 本发明公开了一种基于大模型意图识别与安全协议执行的手机指令控制系统及方法,通过对用户语音指令进行采集与语音识别后,将获得的文本指令发送至云端大模型,在提示约束模板的限定下完成操作指令与非操作内容的区分,并在判定为操作指令时输出包含意图标识与...
  • 本发明属于设备控制技术领域,具体为基于AI视觉与行为预测的穿戴设备控制方法及系统,包括:获取智能穿戴设备数据并进行预处理;对多模态特征集分配伪名称标识,并构建感知数据与行为意图的时序因果链;根据意图概率分布生成轻量化模型,事件驱动预生成语音...
  • 本发明涉及人工智能技术领域,具体地说,涉及一种医疗语音控制方法,其包括如下步骤:采用高保真麦克风在手术室、ICU场景,采集医生指令、患者需求及设备反馈语音,通过短时能量法去除背景噪声,通过卷积循环神经网络结合注意力机制强化语音主频段识别,通...
技术分类