Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开的实施例涉及用于生成声学特征的方法、装置、设备、介质和程序产品。该方法包括获取待处理的目标文本和具有目标音色的语音提示。该方法还包括基于目标文本和与语音提示相对应的提示文本,确定文本嵌入。该方法还包括基于与语音提示对应的提示声学特征,...
  • 本公开的实施例涉及用于编辑语音内容的方法、装置、设备和产品。该方法还包括获取修改文本,修改文本包括与原始音频的原始文本相同的原始部分以及与原始文本不同的修改部分。该方法还包括基于修改文本和原始声学特征,利用基于自注意力的扩散模型来生成与修改...
  • 本公开的实施例涉及用于生成声学特征的方法、装置、设备、介质和程序产品。该方法包括获取待处理的目标文本和具有目标音色的语音提示。该方法还包括基于目标文本和与语音提示相对应的提示文本,确定文本嵌入。该方法还包括基于语音提示的语义特征和目标文本的...
  • 本发明涉及深度学习主动声音设计系统和方法。提供了用于主动声音设计(ASD)生成的系统和方法。该系统可以包括一个或更多个扬声器和计算装置,计算装置包括处理器和存储器。存储器可以配置为存储指令,当由处理器执行该指令时,该指令配置为使处理器接收用...
  • 一种语音交互方法、装置、介质、设备及计算机程序产品,所述方法包括:响应于智能体运行到输出节点,确定所述输出节点对应的文本;若基于所述输出节点的配置信息确定生成语音,则确定所述输出节点对应的音色;基于所述音色确定所述文本对应的语音合成任务,并...
  • 本发明涉及用于多条件音频生成的系统和方法。用于音频生成的方法包括使用编码器针对所获得的输入定义音频输入条件,其中所获得的输入指示一个或多个音频特性。该方法还包括采用音频特征提取神经网络来定义所选音频风格简档的音频风格条件,以及使用多条件潜在...
  • 本发明公开了一种壮文古籍文献音频化方法及系统,该方法通过五大核心模块实现自动化处理:首先,古籍图像处理模块对输入图像进行去噪、二值化、字符分割及质量优化;其次,古壮字映射词库构建模块建立字形与音标的对应关系;再者,光学字符识别模块采用CNN...
  • 本申请实施例公开了一种用于音色克隆的参考音频的选择方法和装置,该方法包括以下步骤:获取音频候选集,音频候选集包括多个候选音频;提取每个候选音频的基础属性,根据基础属性确定每个候选音频的音频质量评分;根据待进行音色克隆的目标文本,评估每个候选...
  • 本发明公开了一种支持动态输入适配的文本转语音硬件加速系统,属于嵌入式平台或边缘计算设备上的文本转语音系统。解决了动态长度语音输入在资源受限硬件平台实时合成时存在的算子兼容性差、计算图静态化困难、量化部署精度损失三大技术问题。技术原理为:通过...
  • 本公开提出一种声浪合成方法、装置、电子设备及存储介质,涉及计算机技术领域。方法包括:根据驾驶员行为进行检测,检测驾驶员是否处于疲劳驾驶状态;响应于驾驶员处于疲劳驾驶状态,根据所述驾驶员行为确定疲劳驾驶系数;确定与车辆当前工况对应的第一音频信...
  • 本申请提供了一种同声传译方法、装置、系统及设备,属于人工智能领域。首先获取第一语音对应的人物特征、情感类别和第一文本。人物特征包括发音特征。其次将采用第一语种的第一文本翻译成采用第二语种的第二文本,第二语种与第一语种不同。然后根据第一语音对...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种思维链与思维模态辅助语音生成方法、装置、设备及介质,包括:接收源文本和用于指定情感表达的文本提示,将文本提示输入语言模型,生成情感控制向量,基于思维链机制处理源文...
  • 本发明提供了基于闽南方言特征识别的电子病历规范化转换方法及系统,包括以下步骤:构建闽南方言声学‑语义联合建模框架;建立基于医疗语境的闽南方言词汇智能映射系统;设计症状描述标准化转换引擎;实现句法结构智能重组机制;建立增量式学习与质量控制机制...
  • 本发明提供一种NLU测试方法、装置、电子设备与存储介质。该方法包括:获取语音信息和语音信息对应的同步信息;同步信息包括:口型信息、肢体动作信息、情绪信息中的至少一种;根据语音信息和同步信息,确定语音信息对应的指令是否有效。本申请同时利用语音...
  • 本发明公开了一种面向普通话水平测试第四题命题说话题目的语音识别方法,包括:步骤1、数据采集,数据来源于命题说话模拟考试题目,对采集的音频数据进行标注,将数据分为训练集、测试集、验证集;步骤2、针对音频时长为3分钟左右,构建集成音频活动检测于...
  • 本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进...
  • 本公开公开了一种语音处理方法、装置及电子设备,其中,该语音处理方法包括:响应于输出第一生成内容期间获得用户输入的第二输入语音,确定所述第一生成内容中已输出的第二生成内容;所述第一生成内容表征利用目标模型生成的针对第一输入语音的模型推理结果;...
  • 本发明涉及一种端侧语音交互方法,属于语音交互技术领域,该方法包括:在端侧设备上,利用压缩感知技术在语音采集端进行亚采样重构语音信号;将重构得到的语音信号输入脉冲神经网络模块提取情绪相关脉冲特征;将情绪相关脉冲特征输入轻量分类网络进行分类;自...
  • 本发明提供在一种基于AI大模型架构的混合语音识别方法及系统,方法包括:构建包含传统ASR系统和AI大模型的ASR系统的混合体系;基于大量无标注音频数据,通过自监督学习对大模型预训练,挖掘音频信号特征,对AI大模型进行有监督微调;在基础层利用...
  • 本发明公开了一种智能文书生成方法、装置、设备及介质。本发明涉及移动通信技术领域。其中,该方法包括:获取文书相关信息并根据确定的录音模式获得声场环境中至少一个人员的音频数据;其中,所述文书相关信息包括所属部门的文书模板;对所述音频数据进行语义...
技术分类