Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了基于AI的多语言自适应识别方法,涉及语言信息处理技术领域,包括以下步骤:采集连续语音流中的节奏特征与停顿节点,提取语速变化轨迹,生成节奏基础稿,用于表征语音信号在时间维度上的节奏变化趋势;基于节奏基础稿对语音信号进行语速变化分解...
  • 本申请实施例适用于计算机软件技术领域,提供了一种关键词检测方法和关键词测检测模型的训练方法,所述方法包括:通过获取待检测语音的声谱特征;在所述声谱特征的时间维度上划分多个至少部分重叠的第一时间窗口;依据各个所述第一时间窗口内的声谱特征,分别...
  • 本申请涉及轻量语音模型部署的技术领域,尤其涉及一种轻量语音检测模型训练方法、装置、设备及存储介质。包括:初始化学生模型,获取语音输入数据;通过预设教师模型生成对应的第一音素概率序列,基于第一音素概率序列对语音输入数据进行语音标注得到语音标注...
  • 本申请提供一种校园欺凌行为识别方法、装置与电子设备。该方法包括:获取校园环境的原始音频数据;对所述原始音频数据进行分割处理,获得按照自然语句划分的多个单句音频片段及其对应的时间戳信息;对各个单句音频片段进行多维特征提取,获得各个单句音频片段...
  • 本申请公开了一种语音识别模型训练方法、使用方法及相关装置,涉及语音处理技术领域,包括:利用初始语音识别模型和第一解码器处理训练数据集,得到第一解码器自回归生成的令牌级解码序列,以及初始语音识别模型中的第二解码器生成的帧级解码序列,利用目标关...
  • 本发明公开了一种宠物声音识别翻译云端训练的方法及应用,涉及语音识别与机器学习技术领域,方法包括数据集构建与预处理、模型架构搭建、两阶段训练、轻量化优化、增量学习迭代、模型评估与部署,应用覆盖多终端场景,双标签标注、多维度数据增强和针对性模型...
  • 本发明提供一种多唤醒词语音识别及其模型训练方法、系统、设备及介质,涉及语音处理领域,包括构建初始轻量化时序模型,所述初始轻量化时序模型包括输入层、卷积层、膨胀卷积层、特征合并层和多维输出层;基于乘加预算约束、抗混淆约束和量化约束,对所述初始...
  • 本公开的目的在于提供一种基于混合噪声生成模型的语音训练加噪系统及方法,包括:输入模块、噪声环境增强模块、语音噪声增强模块以及输出模块;其中,输入模块用于获取噪声环境简易描述信息和待增强的干净语音数据;噪声环境增强模块将噪声环境简易描述信息转...
  • 本发明涉及基于机器学习的想象语音分类方法,包括以下:获取目标对象的EEG信号;对所述EEG信号通过低通滤波器处理得到处理后EEG信号;对处理后EEG信号按预设时间段进行分割得到多个片段的EEG子信号;对所述EEG子信号按照预设的迭代条件进行...
  • 本申请公开了一种语音信号的响应方法、装置、设备、介质及产品。该语音信号的响应方法包括:获取语音信号,所述语音信号中包括人声成分;确定所述语音信号的发声类型,所述发声类型包括真人发声或非真人发声;根据所述语音信号的发声类型确定所述语音信号。上...
  • 本申请公开了一种语音交互的方法、存储介质及电子装置,该语音交互的方法包括:对接收到的目标对象的交互语音进行实时识别,并根据当前对于交互语音的识别结果实时输出中间语音包。根据一个或多个中间语音包确定是否命中预设的目标触发策略;在命中目标触发策...
  • 本发明公开了一种基于大模型的AR展陈童话生成系统及其方法,该系统包括:资源模板库模块包含了多种模板用于指导后续各模块生成对应元素;故事模块用于生成带有舞台剧描述的童话故事;语音模块基于生成的童话故事,生成对应角色的配音音频;图像模块基于生成...
  • 本申请涉及一种嵌入式语音AI定制服务方法、装置、计算机设备及介质,该方法包括获取用户通过客户端接口配置的语义交互信息,语义交互信息包括至少一个唤醒词、多个语义意图及其对应的响应策略;基于语义交互信息及用户上传的语料数据,训练生成语义识别模型...
  • 本发明公开了一种宠物声音识别翻译系统的方法及应用,涉及宠物声音识别翻译技术领域,包括智能项圈端、移动端和云端,三者协同工作;项圈端用于佩戴于目标动物颈部,项圈端包括:麦克风阵列、边缘AI处理器、本地存储模块和低功耗无线通信模块;移动端用于接...
  • 本申请公开了一种语音交互方法、设备以及存储介质,涉及语音交互技术领域,所述语音交互方法应用于车机端,所述车机端包括车机屏幕,所述车机屏幕展示虚拟云车机的镜像界面,所述语音交互方法包括:获取用户语音信息对应的语音识别文本;基于多源界面融合索引...
  • 本发明公开了基于异步触发与语义锚点的双流录音溯源及答案呈现方法。方法包括:获取第一录音数据,以及在第一录音数据的录制过程中即时生成的至少一个第二录音数据;各第二录音数据的录音时间窗口位于第一录音数据的录音时间窗口中;针对各第二录音数据,对第...
  • 本发明涉及人工智能技术领域,提供一种语音识别方法、装置、电子设备和存储介质,方法包括:获取用户语音,以及与用户语音关联的背景文本;基于语音识别模型,应用各词元在背景文本中的出现频次,逐个解码时刻调整对用户语音进行解码的词元输出概率,并应用词...
  • 本申请公开了一种语音交互方法、装置、设备、存储介质及程序产品,涉及智能语音技术领域。该方法包括:获取语音设备自动采集得到的第一语音内容;在语音设备识别第一语音内容失败的情况下,响应于在预设时长范围内接收到第一交互操作,记录第一交互功能与第一...
  • 本公开的实施例提供了用于交互控制的方法、装置、设备、介质和程序产品。该方法包括:由可穿戴设备采集用户的语音信息,可穿戴设备被连接到多个终端设备;基于多个终端设备的活跃状态、优先级以及与可穿戴设备之间的通信连接的有效性中的至少一项,从多个终端...
  • 本公开的实施例提供了用于交互控制的方法、装置、设备、介质和程序产品。该方法包括:从与终端设备连接的可穿戴设备接收用户的语音信息;响应于接收到语音信息,至少基于终端设备处的当前交互状态,确定在终端设备处要执行的目标功能;至少基于语音信息来执行...
技术分类