Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种基于分层式混合模型的具身智能机器人的控制方法, 涉及具身智能领域。本发明基于协同式混合模型架构, 按照ASR文本对应的任务复杂度动态分配处理路径, 将简单任务分配至低延迟的本地文本小模型处理, 将复杂任务分配至高精度的远程多模...
  • 本申请提供了一种驱动方法及相关装置, 该驱动方法基于本申请提供的给予全卷积架构的目标预测模型实现, 可以适用在手机、平板等性能算力较小的移动端上, 能有效扩大了语音驱动模型的应用场景;此外, 由于本申请提供的目标预测模型能根据用户下发的语音...
  • 本发明公开了高精准度多语言实时同传字幕生成方法, 包括以下步骤:操作端选择人工字幕发送模式或机器自动识别字幕发送模式, 选择一种或多种目标语言, 分别形成相应目标语言的字幕信息并根据上会嘉宾的演讲进度发送给投屏端;投屏端接收相应目标语言的字...
  • 本发明公开一种融合多模态感知的智能朗读反馈评估系统, 涉及语言学习技术领域。系统包括音频输入模块采集用户朗读语音, 语音处理模块将语音转文本并提取节奏参数, 双语内容存储模块存双语对应数据, 耳返反馈模块检索目标语言音频并按节奏参数调整播放...
  • 本发明实施例公开了涉及一种语音陪练方法、装置、电子设备及存储介质。该方法包括:获取语音陪练的通用提示词和当前拨测内模拟业务场景中当前轮次对话对应的当前提示词;基于通用提示词、当前提示词和预设文本生成模型, 准确且便捷地生成当前播报文本, 提...
  • 本公开实施例公开一种语音转文字中的关键指代解析方法、装置、介质及产品。其方法包括:构建用户的人际关系知识图谱并按照人际关系类型拆分;用户语音转化的文字序列中包含第三人称代词且满足预设条件时, 获取上下文信息并以此获取第三人称代词的指代对象、...
  • 本发明涉及一种融合嘴部气流、嘴型和语音数据的语音识别装置和方法, 装置包括头戴式主体支架、传感器阵列采集装置和数据处理装置;所述头戴式主体支架包括头戴式支架和传感器支架;所述传感器阵列采集装置包括支座、气流采集模块、图像采集模块和语音采集模...
  • 本发明实施例公开了一种音频处理方法、系统和电子设备, 本实施例的服务端通过接收并识别音频信号, 向客户端反馈流式音频识别结果, 响应于检测到计时时长达到静音配置时长, 发送静音提示信号, 响应于接收到终止信号, 确定音频识别完成, 返回识别...
  • 本发明涉及声纹识别技术领域, 具体涉及一种基于多专家模型的声纹识别方法及其系统;方法包括:采集用户的声纹信号;对采集到的声纹信号进行降噪和归一化操作, 为后续的特征提取做好准备;从预处理后的声纹信号中提取出多个维度的特征, 并将特征输入多专...
  • 本发明涉及音频处理技术领域, 尤其涉及一种基于WeSpeaker架构的隐私增强型语音伪造检测方法, 在具体使用时, 本方法包括三个阶段, 第一个阶段是音频输入与隐私保护预处理阶段, 该阶段通过声学‑语义解耦技术实现语音内容的隐私保护。第二个...
  • 本发明公开了语音识别认证技术领域的基于多模态特征与动态评估的语音识别认证方法及系统, 包括采用麦克风采集用户的原始语音信号, 对所述原始语音信号进行预处理, 得到预处理语音数据;采用多维度特征分层提取技术提取所述预处理语音数据的特征数据, ...
  • 本发明公开了一种基于人工智能的语音处理方法, 属于语音识别技术领域。本发明首先将语音信号划分为多个短时帧, 通过过零率标记出平稳段和扰动段;随后提取平稳段‑平稳段、平稳段‑扰动段、扰动段‑平稳段及扰动段‑扰动段这四种组合;针对每个组合, 提...
  • 本发明涉及数字水印技术领域, 尤其涉及抗同步攻击的音频直方图形状水印方法, 包括:根据预分配的bin的数量, 对预选取的音频样本进行划分, 获取第一时域直方图;对所述第一时域直方图进行分段式DWT变换, 以及进行逆DWT变换, 获取嵌入水印...
  • 本申请涉及一种音频信号的处理方法、装置、计算机设备和可读存储介质, 涉及音频处理技术领域, 方法包括:获取音频信号, 并确定音频信号的当前采样率和目标采样率;基于当前采样率和目标采样率, 确定针对音频信号的转换因子序列;根据滤波器约束条件确...
  • 本发明提供了一种基于超短样本的声音复刻与低延迟流式语音合成方法及系统, 涉及人工智能的技术领域, 适用于智能交互、外呼服务及多模态通信场景, 本发明方法通过创新性的声音复刻模块和语音合成引擎, 实现对智能语音交互的深度个性化定制和超低延迟的...
  • 本发明公开了一种语音转换方法、装置、介质及设备, 所述语音转换方法包括:根据语音转换类型确定输入至语音转换模型中不同编码器的任务数据, 并通过所述语音转换模型中的编码器对输入的任务数据进行编码, 得到每一所述编码器输出的编码特征;获取公共分...
  • 本发明公开了一种语音增强方法、装置、设备、介质及产品。该方法包括:获取用户输入的语音信息对应的待处理频谱图;将所述待处理频谱图输入目标语音增强模型, 得到目标频谱图, 其中, 所述目标语音增强模型包括:多个卷积多焦点注意力模块、多个多核倒置...
  • 本发明涉及音频处理技术领域技术领域, 尤其涉及一种支持AI语言增强的嵌入式音频处理系统及方法, 包括数据采集模块, 音频分析模块, AI增强模块, 音频处理模块;交互输出模块。本发明该系统各模块协作, 数据采集模块收集音频, 分析模块精准分...
  • 本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法, 其中语音噪声分离模型的建立方法包括:获取语音样本数据、噪声样本数据及对应的噪声特性数据;将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据;对所述混合语音...
  • 本发明公开了一种广播信号干扰校正方法、系统、介质及设备, 通过实时采集广播信号并转换为数字信号, 进行预处理以获取第一音频信号, 根据所述第一音频信号进行特征提取获取音频特征, 对不同类型的音频特征进行对应的预处理;整合音频特征生成音频特征...
技术分类