Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及车辆声音处理技术领域,特别涉及一种声音的优化方法、装置、车辆及计算机程序产品,方法包括:接收待测音频,并将待测音频转换为倍频程频谱数据;将倍频程频谱数据输入至声品质评价分析模型进行声品质评价,得到待测音频的声品质评分,并将声品质评...
  • 本发明提供了一种VoIP语音质量测评方法、系统、电子设备及存储介质,涉及通信技术领域。该方法包括如下步骤:通过VoIP电话拨测系统实时获取多组主叫与被叫的音频数据流并对其进行快速傅里叶变换得到频谱数据;对频谱数据进行峰值检测、节奏点检测、响...
  • 本发明提供了基于音频、行为特征识别的霸凌行为检测判断方法及装置,包括:使用音频识别模块提取并分析情绪、关键词和异常声音特征,实时判断是否存在霸凌相关的语言或音频行为;使用行为识别模块进行行为数据处理与时序特征提取,结合GRU网络进行行为分类...
  • 本发明公开了一种基于多麦克风阵列协同的声音采集处理系统,该系统包括声音采集模块、多通道信号预处理模块、声音信号特征提取模块、异常声音识别模块、声源定位模块和报警模块。通过若干麦克风构成圆形布局的多麦克风阵列采集多通道混合数据信号,经回声消除...
  • 本发明公开了一种基于小波卷积和趋势感知的伪造语音检测方法及装置,方法包括以下步骤:步骤S1、获取原始音频数据,对原始音频数据进行频带分解,得到语音初级特征;步骤S2、使用残差单元块对语音初级特征进行预处理,得到中间结果;步骤S3、使用小波卷...
  • 一种基于多维度声纹特征分析的GIS隔离开关分合闸状态监测方法。该方法通过采集GIS隔离开关分合闸过程中的音频信号,提取梅尔频率倒谱系数(MFCC)、短时过零率(ZCR)、时域包络能量、梅尔谱质心、频谱通量作为声纹特征,并利用神经网络模型进行...
  • 一种运行于分布式计算系统中的催收人员动态画像评分方法及系统,系统包括语音接入网关、特征提取服务器、模型训练服务器、动态图表服务器及坐席终端。网关内置AES‑256加密芯片,原始语音流缓存≤30分钟后自动擦除;特征提取服务器对加密语音流执行情...
  • 本发明提供一种基于时频多聚合和交叉高斯注意力的声音分类方法,其可以基于较低参数量,实现较强的模型表征能力,实现长程建模,较好整合全局上下文信息,有效地提升声音分类识别的准确率。其设计了时频多聚合网络,然后引入交叉高斯注意力机制,构建了时频多...
  • 本发明公开了一种基于声波特征的辐射源目标识别方法及装置,其中方法包括:构建辐射源训练集及CRLDN神经网络,使用预处理后的辐射源训练集训练CRLDN神经网络,得到训练完毕的CRLDN神经网络;采集待识别辐射源产生的声波信号,对声波信号进行预...
  • 本发明涉及声纹监测技术领域,公开了一种基于声纹识别的风机监测方法及系统,该方法包括:在待监测风机的叶根层和机舱层部署若干个声纹传感器,根据声纹数据和标准声纹数据的关系对待监测风机构建风机监测标识,基于风机监测标识和因果检验算法确定风机监测区...
  • 本发明涉及攻击检测技术领域,具体涉及一种应用于云呼叫平台的语音深伪攻击检测方法,包括以下步骤:对编码语音流进行解码重构,提取解码过程中的线性预测残差谱矩阵;对所述线性预测残差谱矩阵进行时频梯度方向直方图分析,生成残差断层特征向量;将所述残差...
  • 本发明涉及语音检测技术领域,并提供了基于TinyML的端侧深度合成语音检测方法,包括如下步骤:S100、接收原始音频信号,通过汉明窗进行分帧处理,帧长为20ms,帧移为10ms;S200、提取复合声学特征集,包括:传统声学特征,深度伪造敏感...
  • 本发明公开了一种基于声音相似度的开关柜状态检测方法,包括:通过移动检测设备搭载音频采集装置,按预设路径采集电力设备运行音频数据;对音频数据依次执行归一化处理、滤波处理及滤波标准化处理;采用加窗处理减少频谱泄漏,通过特征增强处理提取有效特征并...
  • 本发明提供的基于掩码重建与时频特征融合的伪造音频检测系统和方法,所述伪造音频检测系统,包括:数据准备模块、频谱特征提取模块、时频特征融合及预测模块、训练模块、以及伪造音频检测模块,通过获取待检测音频的对数梅尔频谱图,通过音频掩码自编码器的双...
  • 本发明公开了一种实时语音基频轮廓提取方法及系统,包括:对接收到的一帧声信号进行预处理,预处理后的信号包括若干个采样点,每个采样点具有对应的幅值;对预处理信号进行局部极值侦测后,获得极大值点集和极小值点集;根据极大值点集和极小值点集,以及第一...
  • 本发明涉及金融、医疗健康及人工智能技术领域,提供一种TTS语音与3D嘴型同步生成方法、装置、设备及介质,利用小样本自适应训练引擎,基于迁移学习框架训练得到TTS语音与3D嘴型的同步生成模型,提高了模型的泛化能力及训练效率;利用多模态联合编码...
  • 本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于多模态语义对齐的决策方法、装置、设备及介质,包括:获取语音、视觉、动作数据并提取各自特征,构建语音、视觉、动作语义图谱,以语音语义图谱为基准执行跨模态对齐生成...
  • 本发明涉及智能音频识别技术领域,公开了耳夹式蓝牙耳机的AI环境声识别系统。该系统包括声音采集模块、声音分区模块、特征映射模块、模型组合模块、数据库更新模块和识别管理模块。声音采集模块捕获环境声音信号并转换为数字音频数据流;声音分区模块预处理...
  • 本发明提供了一种基于多模态融合的耳鸣患者智能社交辅助系统及方法,涉及医疗辅助技术领域,包括:采集环境声音信号、语音信号以及图像数据,并进行初步处理;制定个性化自适应降噪算法以及语音增强算法,进而获得增强语音信号;构建唇语识别模型,对增强语音...
  • 本申请公开了一种音频处理方法、装置、存储介质、电子设备及车辆,涉及车辆技术领域。方法包括:获取待处理音频信号;将待处理音频信号进行快速傅里叶变换,得到频域数据;按预设淡入淡出函数对频域数据进行平滑处理;对经过平滑处理后的频域数据进行快速傅里...
技术分类