Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明属于人工智能与语音识别领域, 具体说是基于改进Transformer架构的语音识别系统, 包括:自定位模块, 用于接收原始音频信号, 并行输出自监督语音特征向量与传统音频特征向量, 并发送至特征归一化转换模块;特征归一化转换模块, 用...
  • 本发明属于传感器测量技术领域, 尤其为一种基于柔性压力传感器的语音识别系统, 包括柔性传感器, 信号处理模块, 无线传输模块和上位机。本发明通过传感器模块采集语音信号, 信号处理模块滤波去噪并加权处理, 传输模块发送数据, 上位机采用改进的...
  • 本申请提供了一种标注模型的训练方法及训练装置, 标注模型包括编码器、解码器和分类器;方法包括:将至少一条音频数据训练样本输入初始标注模型的编码器与解码器, 得到至少一条第一音频处理向量;将音频数据训练样本输入音频处理模型, 得到至少一条第二...
  • 本申请实施例提供了一种多说话人语音识别方法和装置、电子设备及存储介质, 属于人工智能技术领域, 适用于金融科技领域和医疗领域。该方法包括:获取包括至少两个样本说话人的样本音频数据和样本音频数据的样本语音内容;对样本语音内容进行时间戳处理, ...
  • 本申请公开了一种噪声语音识别模型的训练及语音识别方法、装置及设备。该噪声语音识别模型通过语音表征解耦模块, 能够在多变的噪声环境中实现对声学编码器输出的语音表征深度噪声抑制, 提取更清晰的干净去噪特征表示输入至Transducer解码器, ...
  • 本发明涉及自然语言理解技术领域, 具体涉及自然语言理解模型训练方法、装置、电子设备及存储介质。获取目标领域知识以及原始自然语言理解训练数据集;基于目标领域知识以及原始自然语言理解训练数据集, 生成目标领域自然语言理解训练数据集;基于目标领域...
  • 本公开提供一种发言质量评估模型训练、发言质量评估结果生成方法及相关产品。该方法包括:获取发言序列集;根据预训练的大语言模型和发言序列集, 生成对话序列集, 其中, 每个对话序列包括按照第一用户与第二用户的对话顺序排列的第一用户的第一发言和第...
  • 本发明提供基于人工智能实训平台移动端模型轻量化方法, 人工智能模型优化与移动端部署技术领域, 包括:步骤1:对目标AI语音模型的各卷积层进行权重参数监测, 在检测到冗余参数时, 计算层重要性得分和参数稀疏度, 并进行剪枝可行性分析和量化可行...
  • 本发明实施例公开了一种音频处理方法和装置, 所述方法包括遍历基于静音检测结果对音频流进行截取确定的断句列表确定当前断句和当前断句的端点检测结果, 在当前断句存在语句起点时将当前断句的起始帧确定为最新待识别语句的起始帧, 在当前断句存在语句终...
  • 本发明提供一种用于自动语音识别推测解码的草稿序列复用方法, 属于深度学习领域。本发明首先使用轻量级草稿模型进行推测解码, 由目标模型进行验证, 随后通过注意力掩码, 对提交验证和验证通过的两个子序列并行预测, 最终通过两个子序列的连接实现未...
  • 本发明公开了一种人工智能语音识别系统, 包括:多模态特征提取模块:采用改进型Conformer架构同步提取语音信号的时频特征与文本嵌入向量;联合训练模块:通过对抗训练策略联合优化ASR与NMT损失函数, 通过联合训练, 同时学习语音识别和机...
  • 本发明涉及人工智能技术领域, 提供了一种模型质量评测方法、装置、电子设备和存储介质, 方法包括:基于待评测的语音交互大模型, 确定对话数据的应答结果;基于应答结果, 确定语音交互大模型在客观评测指标和主观评测指标下的指标评测结果;基于客观评...
  • 本发明通过构建覆盖多地域、多维度变量的中式方言英语语音语料库, 深入剖析汉语方言音素迁移对语音参数差异的影响, 开创性地将Fujisaki模型、汉语拼音音位理论与隐马尔可夫模型(HMM)进行融合, 实现中式方言英语的高精度自动化语音识别(A...
  • 本发明公开了一种基于AI语音交互的养老服务调度方法及系统, 方法包括:采集用户语音请求及环境感知数据, 对语音请求进行基于深度神经网络的多方言语音识别与意图解析联合处理, 得到结构化服务需求;对环境感知数据进行融合多传感器数据的时空一致性校...
  • 本发明涉及俄语发音教学技术领域, 公开了一种基于AI语音识别的俄语发音纠错系统, 包括:语音输入模块, 用于采集用户俄语语音信号;规则引擎模块, 内置俄语语言学规则库, 包括重音移位规则库和元音弱化声学阈值库, 用于基于规则检测发音错误;深...
  • 本发明提供一种面向供电服务电话系统的非自回归端到端的方言识别方法, 包括以下步骤:双声道电话录音语料预处理、自动预标注与上下文构建、人工标注及方言词库构建、子方言片区划分与分类建模、方言识别模型训练与优化。本发明基于ffmpeg音频处理工具...
  • 本申请公开了一种语音合成方法、装置、设备及存储介质, 属于语音合成技术领域, 用以降低语音合成过程中用户的等待时间。所述方法包括:获取用于进行语音合成的目标文本, 并对目标文本采用多种预设的短句切分方式进行切分, 得到多个第一短句字符串;基...
  • 本申请涉及语音合成技术领域, 尤其涉及音素对齐模型训练及语音合成方法、装置、设备和介质。方法包括:将根据语音训练数据得到频谱特征信息和文本特征信息进行卷积注意力对齐, 得到第一对齐矩阵;基于第一对齐矩阵执行单调对齐搜索生成第二对齐矩阵, 第...
  • 本发明公开了一种读音生成方法、装置、计算机设备及存储介质。该方法可应用在医疗领域和金融保险领域。该方法包括:获取待识别语句, 待识别语句包含多个待识别文字和每一待识别文字对应的文字顺序;在预设检索字典中检索多个待识别文字, 判断每一待识别文...
  • 本发明提供一种基于国际音标的语音转换方法、装置、电子设备及存储介质, 其中的方法包括:确定待转换的当前语音, 当前语音为普通话语音或方言语音;基于预先创建的综合映射表, 将当前语音映射为目标语言国际音标;基于预先训练的文本转语音模型, 根据...
技术分类