Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音信号处理技术领域,具体涉及一种基于风格向量调控的高保真语音风格迁移方法,包括:获取待处理的原始语音信号,对语音信号进行数据预处理,得到待输入语音特征表示;构建并训练神经网络,得到训练好的端到端神经网络模型,作为风格迁移神经网络...
  • 本申请提出了一种数据处理方法、智能终端及存储介质,涉及文本转语音技术领域,数据处理方法包括:将第一频谱分解为至少一第一参数和/或至少一第二参数;根据至少一第一参数和/或至少一第二参数,确定或生成语音数据。本申请提出的技术方案,可以提高文本转...
  • 本发明提供了一种基于语音识别的社交聆听方法及装置,属于社交媒体数据处理与语音识别交叉技术领域。该方法包括:从社交媒体平台实时采集语音内容,对采集的语音内容进行格式统一转换、噪声滤除及音频切片预处理,得到标准化语音数据;利用深度学习语音识别模...
  • 本发明公开了一种基于多通道可学习小波变换的语音识别采样方法,属于自动语音识别技术技术领域;方法为:获取语音信号计算后的fbank频谱图;构建语音识别模型,采用可学习小波变换方法对语音识别模型进行优化;基于优化后的语音识别模型完成语音识别采样...
  • 本公开提供了一种语音识别方法及装置、电子设备、存储介质、程序产品,该方法包括:对待识别的语音数据进行频域特征提取,得到第一频域特征;对所述第一频域特征降噪,得到降噪后的第二频域特征;对所述第一频域特征和所述第二频域特征进行语义特征提取及特征...
  • 本申请提供了一种信号处理方法、模型训练方法、装置、设备、介质及产品,该方法包括:获取多个通道的音频信号;调用特征获取模块,根据多个通道的音频信号获取第一融合特征,第一融合特征用于表征多个通道的音频信号的文本信息和空间信息;调用声源定位模块,...
  • 本公开提供一种基于隐马尔可夫模型与神经网络的特征声音识别方法及系统,通过提取隐马尔可夫模型中全部状态的累积概率构建多维特征向量,并将该向量输入至隐层神经元数量可动态调整的自组织神经网络分类器,利用竞争学习机制实现声音特征的深度聚类,有效克服...
  • 本申请提供了一种基于车间生产操作场景的语音识别软件交互实现方法,涉及人机交互与软件工程技术技术领域,包括:构建智能生产语音识别应用;构建所述智能生产语音识别应用与智能生产软件服务之间的全双工通信通道;构建软件操作组件;通过所述智能生产语音识...
  • 本申请涉及自然语言处理技术领域,具体公开了一种语音服务话术生成方法、装置、计算机设备及存储介质。本申请首先根据体检预约信息生成初始服务话术,然后在外呼人员根据初始服务话术与待体检用户沟通的过程中,根据待体检用户的反馈信息,实时调整服务话术,...
  • 本发明公开了一种基于多模态感知的智能助听耳机语义交互方法及系统,包括以下步骤:通过集成于智能助听耳机本体的多模态信号采集单元获取用户语音信号与环境声学信号;进行协同降噪处理,生成增强语音流;基于增强语音流得到语义理解结果,并生成第一响应集合...
  • 本发明公开了一种家庭防诈骗实时语义识别方法及系统,涉及家庭安全防护技术领域;包括以下步骤:通过预设数量的麦克风实时采集家庭环境中的对话音频信号;将对话音频信号通过语音识别编码器转化为语义向量形式的隐含特征表示;通过在大规模语料上的预训练知识...
  • 本申请公开了一种语音识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于若干对同音词和近音词构建目标数据集,并基于目标数据集对第一自动语音识别模型进行微调得到第三自动语音识别模型;确定目标音频的声学特征序列,并生成声学特征序列对...
  • 本申请属于电器技术领域,具体涉及一种一种衣物处理程序推荐方法、装置、设备及存储介质。本申请包括:接收用户发送的语音指令信息,获取语音指令信息中的语义关键词,在确定语义关键词中不包括有效用户意图关键词时,从语义关键词中获取衣物处理关键词;按照...
  • 本公开提供一种语音唤醒方法、装置、电子设备及计算机可读存储介质,涉及语音处理技术领域。所述方法包括:获取待处理音频流;对所述待处理音频流进行分帧处理,得到多个音频帧,并确定各所述音频帧的声学得分;依据所述声学得分判断所述待处理音频流是否包含...
  • 本发明公开了一种基于无监督数据生成精标数据的方法及系统,涉及文本处理以及语音识别技术领域,包括:获取短句,对短句进行质量筛选,得到高音频质量的短句;对高音频质量的短句进行说话人分类筛选,得到筛选后的单人说话短句,对单人说话短句施加随机噪声得...
  • 本申请公开了一种问答方法、装置及存储介质。涉及人工智能领域,该方法包括:接收目标用户从前端页面录入的语音数据;依据语音数据确定对应的文本数据;将文本数据输入零售销售问答大模型,以利用零售销售问答大模型输出文本数据对应的回复结果;将回复结果发...
  • 本发明涉及车辆控制技术领域,尤其是涉及一种基于多模态信息的车辆控制方法、装置及电子设备、存储介质,该方法应用于车机端;该方法对采集的乘车人员的原始声纹数据进行特征提取,得到梅尔频率倒谱系数声学特征;基于所述梅尔频率倒谱系数声学特征与所述乘车...
  • 本申请涉及一种设备的声控灵敏度调节方法、装置、设备及存储介质,该声控灵敏度调节方法通过接收声控灵敏度调节指令,并进入声控灵敏度调节模式;在所述声控灵敏度调节模式下,基于采集到的灵敏度配置信息调整设备的声控灵敏度,其中,每个声控灵敏度对应设置...
  • 本发明提供一种应用于空管场景的语音指令智能解析方法及系统,涉及航空交通管制技术领域,针对空管场景下管制员与机组人员语音指令交互的特点,构建指令交互预期模型,该指令交互预期模型包含基于历史管制通话数据生成的指令序列关联规则和语义约束条件集合,...
  • 本发明涉及语音干扰因素判断方法领域,具体涉及一种语音交互性能影响因素判定及优化方法,包括:步骤1,构建语音交互过程中影响因素的正交试验层析分析模型,所述正交试验层析分析模型包括,第1层的试验考核指标层、第2层的因素层,第3层的水平层;步骤2...
技术分类