Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了具有灵活情绪控制的合成语音生成, 具体公开了可以使用机器学习来生成人工语音的装置、系统和技术。该技术包括:使用与目标情绪程度相关联并且通过组合与相应参考情绪程度相关联的多个参考语音嵌入获得的机器学习模型可读的语音嵌入来生成合成语...
  • 本公开提供同声传译方法、装置、电子设备和存储介质。同声传译方法, 包括:在第一通信组实时的多媒体通信过程中, 接收第一通信组的成员的第一语音信息;确定发出第一语音信息的成员的目标语音特征;根据目标语音特征生成第二语音信息, 并以第一传译机器...
  • 本发明公开基于语义感知的开放场景英语语音评估方法及系统, 涉及语音评估技术领域, 对音频数据进行特征提取, 得到帧级声学特征;对音频数据进行识别得到转录文本, 将转录文本和音频数据对应的主题文本输入语言模型进行处理, 得到转录文本的单词级表...
  • 本发明公开一种确定学生小组讨论热度的方法、装置、设备及存储介质。其中, 该方法包括:获取小组讨论的语音数据的频谱特征、语音流特征;根据所述频谱特征和所述语音流特征, 提取小组讨论的第一关键特征, 其中, 所述第一关键特征包括:发言对象个数、...
  • 本发明提出语音序列的重点子序列识别与显示方法, 包括步骤S510:获取当前语音序列;S520:识别当前语音序列包含的停顿点的第一数量, 激活第二数量的重点子序列识别进程;S530:将当前语音序列以第一数量的停顿点为单位, 切分为第三数量的语...
  • 本申请涉及到语音识别技术领域, 公开了一种多意图处理方法、装置、设备及介质, 其中方法包括:首先基于预设命令词生成含同义表述的文本语料, 经语音合成转换为音频语料, 构建“文本‑音频”配对的泛化数据集;接着以该泛化数据集为训练数据, 联合训...
  • 一种展厅语音交互方法及系统, 所述方法包括:采集展厅的环境数据和用户声源数据;根据环境数据和用户声源数据判断是否需要移动追踪声源;基于用户声源数据和用户视觉数据对用户进行定位追踪;在不需要移动追踪声源时, 将环境数据、用户相关数据和机器人上...
  • 本公开涉及一种内容展示方法、装置、设备、介质及车辆。本公开通过响应于接收到当前用户的语音控制展示指令, 识别语音控制展示指令中是否存在请求展示的内容对象以及内容对象所属的与当前用户相关的第一称谓关系词;若语音控制展示指令中存在内容对象以及第...
  • 一种庙宇语音数字资讯辨识模块, 包含语音识别单元、数据库单元及控制单元, 所述语音识别单元用于接收一段语音, 并将所述语音转换为文字资讯, 所述数据库单元储存多个资料集合, 每一个资料集合具有使用编号, 及对应所述使用编号的使用资料, 所述...
  • 本发明公开了一种基于AI语音交互的汽车座椅电机智能滑轨调节系统, 包括如下模块:本地语音唤醒模块, 用于监听用户语音输入, 检测预设唤醒关键词后, 激活语音识别模块;语音识别模块, 用于生成标准化文本指令;语义建模模块, 用于对标准化文本指...
  • 本发明涉及智能控制技术领域, 具体涉及基于人工智能的浴霸语音智能控制系统及方法。具体为:利用声音传感器收集浴室声音信息, 将收集的浴室声音信号输入至语音信号识别机制, 根据语音信号识别机制的检测结果识别出的控制语音信号;对识别的控制语音信号...
  • 本发明提供一种研磨机语音控制方法、控制电路及研磨机, 研磨机语音控制方法的步骤包括:获取用户的语音控制指令;当检测到语音控制指令为粗细设置指令时, 设定研磨机的研磨粗细参数;当检测到语音控制指令为研磨设置指令时, 设定研磨机的研磨转动参数;...
  • 本发明公开一种基于大语言模型的构音障碍语音实时转换系统, 包括:基于ASR的语音识别模块, 采用Whisper ASR模型将构音障碍患者的输入语音转换为初始文本;基于LLM的语义修正模块, 集成Qwen2.5‑7B‑Instruct大语言模...
  • 本申请涉及语音识别技术领域, 公开一种语音识别方法、设备、存储介质和计算机程序产品, 方案中电子设备响应用户操作, 加载动态术语库, 并从显示装置显示的会议内容画面中提取临时词汇, 将临时词汇存储至临时术语库, 实现临时术语库的更新。电子设...
  • 本申请涉及一种鸟类声纹采集识别系统。所述系统包括:数据获取模块, 用于获取目标区域的气象参数, 生成动态气象数据集;声学建模处理模块, 用于对所述动态气象数据集进行声学建模处理, 建立包含声速修正项和大气衰减项的气象‑声纹耦合方程;声纹校准...
  • 本发明涉及语音通信技术领域, 公开了双组人声同步采集的频域降噪与还原方法及系统, 该方法通过双组采集点获取同步信号, 构建双源频域坐标系并映射为能量分布点;计算空间关系识别情绪失真状态, 划分四象限生成失真类型标记;据此分割频域信号并执行针...
  • 描述了用于动态音频客观化的技术。实施方案包括将来自音频信号的第一音频片段提供到基于标记有音频源的音频片段进行训练的机器学习模型, 并且从所述机器学习模型接收与所述音频源相关联的所述第一音频片段的子集。实施方案包括在播放重建的第一音频片段之后...
  • 本发明提供一种基于自组网麦克风阵列的几何感知语音分离方法, 包括:对麦克风阵列捕获的多通道音频进行时频变换, 提取对数幅度谱和相位谱并融合, 通过复值比滤波器预分离后, 生成包含麦克风对空间相关性的协方差矩阵;将所述协方差矩阵输入特征共享网...
  • 本发明公开了一种面向实时语音交互的多人语音分离与识别系统及方法, 属于语音信号处理技术领域。技术原理包括:通过音频采集模块分割流式语音并存入循环队列;预处理模块转换为标准wav文件;语音分离模块采用SepFormer模型分离说话人轨迹;语音...
  • 本公开提供一种语音信号处理方法及装置、存储介质及电子设备, 其中, 所述语音信号处理方法包括:分别获取传声器阵列中每一个传声器采集到的混合语音信号, 所述混合语音信号中包括至少两个声源发出的语音信号。分别确定每一个传声器与至少两个声源中每一...
技术分类