Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于文本和语音表征融合的多层次判定的会议说话人转换点识别方法,涉及语音信号处理及人工智能技术领域。该方法先对原始音频流进行预处理提取有效语音片段,再通过低延迟流式语音识别获取转写文本及字符时间戳,生成词级时间戳并切分词级音频...
  • 本发明公开了一种铁路通信系统语音传输方法、装置、设备、介质及程序产品,涉及铁路通信技术领域。该方法包括:通过第一终端,获取用户验证语音和用户参考声纹特征,并对用户验证语音进行特征提取,得到用户验证声纹特征;通过第一终端,根据用户参考声纹特征...
  • 本发明公开了一种适用于端侧设备的多说话人语音识别方法和系统,方法包括:采集多说话人音频数据,并对所述多说话人音频采用声道分离方法分解为两个单说话人音频,对每个单说话人音频进行活动检测,将每个单说话人音频分割为多段有效音段;对所述时间序列上的...
  • 本发明提供一种音频处理方法、智能穿戴设备及存储介质,该音频处理方法包括采用逻辑处理模块执行以下步骤:接收用户基于应用处理系统下发的串口指令,并根据串口指令确认待执行任务;当待执行任务包括音频算法处理任务时,控制数据搬运模块将外部闪存模块中与...
  • 本发明公开了一种语音识别方法及装置、存储介质、计算机设备,涉及语音识别技术领域,可应用于数字医疗和金融领域。主要目的在于解决语音识别效率较低的问题。主要包括获取待识别语音和待识别语音的交互场景信息;对待识别语音进行识别,得到初始转换文本和初...
  • 本申请提供了一种语音数据处理方法、装置、电子设备、介质和程序产品,涉及大模型在远程语音交互中的应用,可以应用于人工智能技术领域。所述方法包括:接收由客户端发送的目标信息片段,目标信息片段由客户端对远程交互语音对应的数据进行分析和提取获得;基...
  • 本申请提供数据处理方法、诗词语音合成模型训练方法,其中所述数据处理方法包括:获取待处理诗词音频,确定待处理诗词音频对应的拼音文本为待处理拼音文本;在预先存储的各原始拼音文本中,确定与待处理拼音文本匹配的目标拼音文本;根据预先构建的诗词拼音对...
  • 本发明公开了一种基于语音识别的远程认知评估系统,涉及认知评估技术领域。本发明包括云服务器、集中器和n个穿戴设备,穿戴设备包括时钟模块、通信模块、计算模块、闪存模块、供电模块和拾音器,穿戴设备实时获取佩戴者的语音信息执行分支处理得到若干不同类...
  • 本申请涉及语义识别技术领域,尤其涉及一种基于热词引导的教师课堂语音识别方法、系统及可读存储介质。通过构建与教学场景强相关的热词库,将热词库中的热词进行数据处理后获得特征凸显的融合特征后,输入至大语言模型中进行语音识别,使模型能够利用热词信息...
  • 本发明属于人工智能与语音处理技术领域,具体涉及一种面向普通话的自动语音识别方法、系统、设备和介质,能够实现兼顾识别精度与运行效率的轻量化自动语音识别。本发明不仅在准确性和速度上优于传统模型,而且在设计上考虑了资源效率,使其能在不同的硬件环境...
  • 本发明提供一种道岔静态检查结果语音智能录入方法及装置,包括:获取道岔静态检查语音信息,通过道岔静态检查语音模型结合预设提示词转换为原始文本;利用道岔静态检查的多模式字符串匹配自动机处理原始文本,得到纠正后的道岔静态检查文本;基于道岔静态检查...
  • 本申请公开了一种音频处理方法、装置、设备、介质、产品,该方法包括:获取音频序列,该音频序列包括第一序列和第二序列,该第一序列中至少一帧音频在该音频序列中对应的采集时间早于该第二序列中各帧音频在该音频序列中对应的采集时间,该第一序列和该第二序...
  • 本申请公开一种咖啡机语音交互方法及系统,涉及语音交互技术领域。该方法包括:在咖啡机未进行语音交互时,对厨房空间进行探测并监听环境背景声音,构建并动态更新至少表征噪声源物理位置、声学特征及声反射路径的厨房环境声学空间模型;检测到用户语音指令时...
  • 本申请涉及一种基于神经网络的智慧课堂语音识别方法、系统、设备及介质。所述方法包括:获取课堂环境的带噪语音数据并进行特征提取得到语音特征集合;通过噪声分类器识别主导课堂噪声类型得到噪声类型标识;通过噪声类型标识对应的卷积核配置对语音特征集合进...
  • 本发明涉及电动车控制技术领域,公开了一种电动车的仪表控制面板交互方法与系统,该方法包括:利用多维传感器按照默认采样率实时采集骑行数据;通过微动力学估算与一维鸟瞰图映射,识别电动车当前的行驶场景;并通过双重防抖与预测验证,输出包含时序预测与量...
  • 本申请涉及语音生成技术领域,具体公开了一种基于频谱图的语音问答生成方法、装置、设备及存储介质。将提问语音音频转换为梅尔频谱图而非离散语音量化处理,保留了丰富的声学特征和语义信息,提高了回答文本和语音的准确率,并采用流式传输方式,无需等待完整...
  • 本申请提供一种车载无人机语音控制系统、方法、电子设备及介质,涉及智能语音交互领域,该系统包括:语音采集模块,设置于车辆的前后保险杠及侧裙区域,用于采集用户的语音指令;语音处理模块,与语音采集模块通信连接,用于对采集到的语音指令进行声纹认证;...
  • 本发明公开了一种基于大语言模型融合的语音对话交互方法及系统,包括:获取用户的实时语音流数据,对音流数据进行识别,获取第一文本数据;对第一文本数据进行意图识别,提取语义中的意图和意图对应的槽位信息;提取实时语音流数据的元数据,基于元数据、意图...
  • 本申请提供了一种低功耗自定义唤醒方法、装置、电子设备及存储介质,涉及电子设备技术领域,上述方法包括:获取待识别语音数据;利用预先训练的融合特征提取模型,提取待识别语音数据的文本与声纹的融合特征;其中,融合特征提取模型是利用预先建立的批量二维...
  • 本发明涉及语音语义技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音交互的控制方法、装置、设备及介质,包括:获取多模态感知数据构建动态场景模型;提取会话特征参数输入决策模型生成策略参数集合;依据策略参数集合和语音交互设备语音特...
技术分类