Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种多功能大功率可编程声波发射阵列系统,包括电源管理模块、声波信号生成模块、功率放大模块、阵列驱动模块、波束成形模块、实时校准模块、人机交互模块、数据存储与通信模块、场景适配模块以及安全保护模块;本发明通过场景适配模块的预设模板...
  • 本申请涉及一种语音数据生成方法、教学场景的语音生成方法及电子设备。该语音数据生成方法包括:提取古诗文的第一文本表征;通过具有韵律的文本编码器提取古诗文的目标特征;将第一文本表征和目标特征进行融合,生成具有韵律的文本特征;对具有韵律的文本特征...
  • 本申请公开了一种车内语音交互方法、系统、设备、存储介质以及程序产品,涉及智能座舱与人机交互技术领域,包括:对车内语音信号进行触发词检测以及语义理解,确定是否触发车内人员主动请求事件;若触发车内人员主动请求事件,则对车内语音信号进行意图识别和...
  • 本申请公开了一种车外语音交互方法、系统、设备、存储介质以及程序产品,涉及智能座舱与人机交互技术领域,包括:采集车外语音信号和外部感知信息;基于车外语音信号及声源定位结果,判断是否触发车外人员被动请求事件,并进一步进行可信度评估以决定是否系统...
  • 本申请公开了一种车内外语音交互方法、系统、设备以及存储介质,涉及智能座舱与人机交互技术领域,包括:采集感知数据;基于感知数据和/或车辆事件,识别交互触发类型(车内主动请求、车外被动请求或系统主动触发);根据触发类型,确定对应的响应许可策略,...
  • 本发明公开了一种用于网约车平台的个性化语音定制系统、方法、电子设备及介质,系统包括如下模块:特征提取模块:采用WavLM语音模型对原语音、目标语音进行特征提取;时序对齐和转换模块:采用最小距离准则将原语音的特征与目标语音的特征进行时序对齐,...
  • 本申请公开了伪耳语生成方法、装置及设备。其中,伪耳语生成方法通过获取常态语音;提取常态语音的多尺度声学特征;基于多尺度声学特征,确定能代表发声用力和清晰程度的发声努力度;基于发声努力度进行跨域声学参数的联合调制,包括时间域、频率域和激励域中...
  • 本申请涉及一种音频文件生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。方法包括:响应于多媒体内容输入事件,获取目标多媒体内容;基于特征分析模型对目标多媒体内容进行多模态特征分析,获取目标多媒体内容的多模态特征;基于多模态特征...
  • 本申请公开了一种多语种语音合成方法及相关装置,涉及语音合成技术领域,包括:获取待语音合成的目标数据,调用语音合成模型根据目标数据生成语音离散标记序列,语音合成模型集成有混合专家网络MoE,MoE的门控网络包括第一分支网络和第二分支网络,第一...
  • 本申请公开了一种语音合成方法及装置、计算机可读存储介质、计算机设备,涉及人工智能技术领域,主要目的在于解决现有语音合成有效性差的问题。包括:获取待合成的会话提示语音以及环境提示语音;对会话提示语音以及环境提示语音进行特征提取,得到会话特征以...
  • 本发明涉及语音合成技术领域,公开了一种文本转换语音方法、装置、设备及介质,将扩散模型的原始训练损失作为内部正则化惩罚项,与外部人类偏好奖励相结合构建组合优化目标对文本转语音扩散模型进行优化,从而在强化学习微调过程中能够确保优化过程的稳定,在...
  • 本发明公开了基于AI的多语言自适应识别方法,涉及语言信息处理技术领域,包括以下步骤:采集连续语音流中的节奏特征与停顿节点,提取语速变化轨迹,生成节奏基础稿,用于表征语音信号在时间维度上的节奏变化趋势;基于节奏基础稿对语音信号进行语速变化分解...
  • 本申请实施例适用于计算机软件技术领域,提供了一种关键词检测方法和关键词测检测模型的训练方法,所述方法包括:通过获取待检测语音的声谱特征;在所述声谱特征的时间维度上划分多个至少部分重叠的第一时间窗口;依据各个所述第一时间窗口内的声谱特征,分别...
  • 本申请涉及轻量语音模型部署的技术领域,尤其涉及一种轻量语音检测模型训练方法、装置、设备及存储介质。包括:初始化学生模型,获取语音输入数据;通过预设教师模型生成对应的第一音素概率序列,基于第一音素概率序列对语音输入数据进行语音标注得到语音标注...
  • 本申请提供一种校园欺凌行为识别方法、装置与电子设备。该方法包括:获取校园环境的原始音频数据;对所述原始音频数据进行分割处理,获得按照自然语句划分的多个单句音频片段及其对应的时间戳信息;对各个单句音频片段进行多维特征提取,获得各个单句音频片段...
  • 本申请公开了一种语音识别模型训练方法、使用方法及相关装置,涉及语音处理技术领域,包括:利用初始语音识别模型和第一解码器处理训练数据集,得到第一解码器自回归生成的令牌级解码序列,以及初始语音识别模型中的第二解码器生成的帧级解码序列,利用目标关...
  • 本发明公开了一种宠物声音识别翻译云端训练的方法及应用,涉及语音识别与机器学习技术领域,方法包括数据集构建与预处理、模型架构搭建、两阶段训练、轻量化优化、增量学习迭代、模型评估与部署,应用覆盖多终端场景,双标签标注、多维度数据增强和针对性模型...
  • 本发明提供一种多唤醒词语音识别及其模型训练方法、系统、设备及介质,涉及语音处理领域,包括构建初始轻量化时序模型,所述初始轻量化时序模型包括输入层、卷积层、膨胀卷积层、特征合并层和多维输出层;基于乘加预算约束、抗混淆约束和量化约束,对所述初始...
  • 本公开的目的在于提供一种基于混合噪声生成模型的语音训练加噪系统及方法,包括:输入模块、噪声环境增强模块、语音噪声增强模块以及输出模块;其中,输入模块用于获取噪声环境简易描述信息和待增强的干净语音数据;噪声环境增强模块将噪声环境简易描述信息转...
  • 本发明涉及基于机器学习的想象语音分类方法,包括以下:获取目标对象的EEG信号;对所述EEG信号通过低通滤波器处理得到处理后EEG信号;对处理后EEG信号按预设时间段进行分割得到多个片段的EEG子信号;对所述EEG子信号按照预设的迭代条件进行...
技术分类