Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供性能高的磁盘装置。本实施方式的磁盘装置具备磁盘、磁头及控制器。磁盘具备多个磁道,控制器将与圆周方向的多个第1位置的每一个关联的第1阈值,基于圆周方向的多个第2位置中的与各第1位置对应的1个以上的第2位置各自的品质而按各第1位置分别...
  • 本公开提供感情推测方法、信息处理装置、以及非临时性存储介质。信息处理装置执行的感情推测方法包括:取得声音数据;判定所述声音数据是否包含语言信息;以及在所述声音数据包含语言信息的情况下,向根据语言信息推测感情的第1推测模型输入所述声音数据,推...
  • 本公开提供感情推测方法。信息处理装置执行的感情推测方法包括:取得声音数据;将声音数据输入到学习模型,至少分离为第1矢量数据和第2矢量数据;以及至少根据第1矢量数据和第2矢量数据,推测与所述声音数据对应的感情,其中,学习模型根据基于语言信息和...
  • 本公开提供感情推测方法。信息处理装置执行的感情推测方法包括:取得声音数据;将声音数据输入到学习模型,分离为第1矢量数据和第2矢量数据;将第1矢量数据输入到第1推测模型,推测基于语言信息的感情;以及将第2矢量数据输入到第2推测模型,推测基于非...
  • 本申请涉及一种基于多维度协同优化的复杂场景语音识别方法和装置,该方法包括获取待优化的原始语音数据,对原始语音数据进行语音质量检测、无效语音去除、噪声抑制和语音切片处理,得到语音短片段;采用调优语音识别大模型对语音短片段进行语音识别,得到语音...
  • 本发明公开了基于深度学习的早期语言能力评估与提升方法及系统,涉及儿童语言发展评估技术领域,现提出如下方案,其包括获取儿童的非连续语音流数据,通过预训练的深度神经网络模型进行端点检测并分割生成语音片段,识别各语音片段并纳入不同类型的语法槽内,...
  • 本申请实施例涉及语音处理技术领域,公开了一种口语发音评测方法、模型的训练方法及电子设备,口语发音评测方法包括:获取用户朗读音频和对应的文本;根据文本对用户朗读音频进行分数评估,以得到原始评测分数;提取用户朗读音频的音频特征,并对音频特征进行...
  • 本发明涉及煤矿智能监测与故障诊断技术领域,尤其涉及基于声音阵列与时空特征网络的刮板机断联识别监测方法,包括:布设8×n防爆麦克风阵列采集全链条声学信号;构建含正常及多种故障工况的标注数据集;通过自适应谱减与改进波束形成进行多通道去噪与聚焦;...
  • 本发明提供一种基于双重交互查询的语音反欺骗方法和系统,涉及语音识别技术领域。本发明针对现有技术无法很好的兼顾深度伪造语音检测的性能与效率这一技术问题,提出了基于双重交互查询的音频理解模型。该模型利用基于交叉注意力的双分支处理模块中的局部模式...
  • 本发明涉及变压器故障诊断技术领域,尤其是一种基于生成式声学大模型增强的变压器故障诊断方法及系统,该方法包括:构建生成式声学大模型,利用声学语义提示符生成指定虚拟基准梅尔频谱特征数据,配置条件自编码模型基于诊断条件标签以及当前的基准梅尔频谱特...
  • 本申请涉及一种基于声音与温度融合感知的烹饪状态识别方法及系统,通过获取并处理包含锅具特征声音的混合音频信号,实现了对烹饪过程伴生声学信息的有效捕获与特征化表征;通过获取锅具底部的实时温度数据,实现了对烹饪核心热力状态的直接量化监测;进而,通...
  • 本申请公开了一种车载屏综合监测系统及方法,涉及屏幕测试技术领域。其中车载屏综合监测系统,包括:声音监测模块,用于获取车载屏被操作时所产生的声音;视频监测模块,用于获取车载屏被操作时的操作动作和屏幕响应;数据分析模块,被配置为:从声音监测模块...
  • 本申请提供了一种数据处理方法、装置、设备、介质及产品,该方法包括:获取业务场景中采集到的多模态数据,该多模态数据包括音频数据和视觉数据;音频数据包含对业务场景中的N个对象进行音频信号采集得到的多声源音频信号,视觉数据包含在采集多声源音频信号...
  • 本申请公开了一种变电站噪声智能分离方法、装置、设备及介质,涉及音频处理领域,包括:采集若干目标设备工作时产生的设备噪声,并对设备噪声预处理,以基于得到的预处理后噪声数据构建目标混合噪声数据集;对原始音频信号进行混合,并对得到的混合音频信号分...
  • 本申请涉及一种组合电器的击穿声学信号的去噪方法、装置、设备、存储介质。方法包括:采集受环境噪声污染的组合电器击穿声学信号并建模为原始无噪声击穿信号与噪声信号叠加的带噪信号;将带噪信号划分为连续重叠的信号帧,对各帧施加窗函数后执行快速傅里叶变...
  • 本发明公开一种基于动态降噪链及反馈优化的降噪方法及系统,方法包括:获取原始语音数据;构建场景识别模型,对原始语音数据进行多尺度特征提取得到语音特征数据,通过多通道建模分析及特征融合,得到融合特征数据,基于融合特征数据得到场景概率分布,进而得...
  • 本公开的实施例提供了一种用于语音合成的方法、装置、设备和可读存储介质。在本公开的实施例中,获取与目标文本对应的初始声学特征。在声码器模型包括的残差网络中,利用残差网络对初始声学特征执行卷积操作,以得到与残差网络中的多个扩张卷积层各自对应的多...
  • 本申请公开了一种混合编码数据流解码方法及相关装置,涉及人工智能技术领域,本申请方案当接收端遇到编码未知的混合编码数据流时,利用大语言模型强大的模式识别与语义理解能力,自动解析出混合编码数据流对应的解码逻辑规则, 基于所述混合编码数据流对应的...
  • 本发明公开了多模态融合的声纹识别模型训练方法及系统,涉及工业自动化控制与生物特征识别技术领域。包括:获取操作人员语音指令数据;下发操作指令触发调取设备历史状态日志及测量数据;基于日志设置性能阈值范围,与时间窗内设备状态变化量匹配——当状态变...
  • 本申请涉及人工智能技术领域,公开了一种面审视频数据的违规提示检测方法、装置、设备及介质,包括:同步分离面审视频的音频流与视频流;对音频流进行语音活动检测得到有效语音段集合,同时对视频流进行唇部运动分析得到用户说话状态的时段集合;将两者时间对...
技术分类