Document
拖动滑块完成拼图
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开涉及一种AI驱动的泛屏运营方法、装置及电子设备。该方法包括:响应于接收到由运营人员输入的运营指令,对运营指令进行解析,并识别运营意图,其中运营指令为基于自然语言的指令;基于运营意图调用至少一个AI服务,以生成与运营意图对应的运营操作序...
  • 本发明公开了一种展厅导览机器人的语音交互方法、装置、电子设备及存储介质,属于语音信号处理领域,所述方法包括:实时采集展厅多通道远场语音信号,并同步获取导览机器人的音频参考信号、定位坐标及麦克风阵列结构。依据背景噪声功率谱计算噪声抑制参数,对...
  • 本发明涉及一种音频采集方法、装置、设备以及介质,涉及语音交互技术领域,该方法包括:获取目标音频的目标有效帧以及标识帧;所述目标有效帧为与所述标识帧邻接的有效帧,所述标识帧包括缓存帧以及补充帧;根据所述目标有效帧的振幅以及过零率提取所述标识帧...
  • 本申请涉及洗衣机智能控制技术领域,具体提供一种语音反馈方法、控制器、存储介质及终端设备,旨在解决现有语音识别方法无法满足用户的个性化需求导致用户体验感较差的问题。为此目的,本申请提供的方法包括:获取音频指令对应的发声人的图像信息,从图像信息...
  • 本发明公开了一种基于声纹和热成像数据融合的动态身份监测系统,涉及信息安全与生物识别技术领域,通过采集用户面部热成像图像并输入预训练的深度神经网络模型,系统可判断用户是否处于异常状态如胁迫或紧张;同时,系统提取用户声纹特征与预注册模板进行比对...
  • 本发明公开了一种联合语音克隆的声纹比对方法及系统,包括以下步骤:构建联合语音克隆的声纹比对网络;训练所述声纹比对网络,获得训练好的声纹比对模型;利用所述声纹比对模型进行声纹比对;其中,所述声纹比对网络包括:语音编码器,对待比对语音进行编码,...
  • 本发明公开了一种说话主体识别方法、装置、设备及可读存储介质,应用于计算机技术领域,包括:从有效语音片段中进行声纹提取,得到声纹向量,确定各个声纹向量间的相似度,并基于相似度进行聚类,生成各个说活主体对应的临时标识;将无效语音片段标记为待确定...
  • 本申请公开了一种高压输电线路局部放电信号声纹识别方法,包括以下步骤:采集环境噪声与局部放电信号;采用变分模态分解(VMD)对信号进行分解,依据中心频率筛选模态分量并重构,实现有效降噪;对降噪后信号进行数据截取、样本划分及归一化处理;构建卷积...
  • 本公开提供了一种语音通信方法、装置及相关设备,应用于通信技术领域。该方法包括:获取采集的语音数据;提取语音数据中的文本数据和韵律特征数据;对韵律特征数据进行压缩编码,得到韵律向量;将文本数据和韵律向量封装为协同编码数据包;向第二终端发送协同...
  • 本发明公开一种基于主成分分析与多尺度深度注意力的语音编解码方法,涉及语音信号处理技术领域,包括:对语音信号进行多次多尺度深度注意力卷积操作后得到第一特征;其中通过多个并行且深度卷积核不同的深度可分离卷积分别进行特征提取且经特征融合后,对融合...
  • 本发明提供一种超低时延信号序列转换方法及系统,可以广泛应用在各种时序转换的场景,包括应用在听力增强的系统和设备中,例如助听、去噪、同声翻译、声音转换信号序列、智能眼镜、脑机系统等。本发明采用快速高保真噪声消除方法,可以克服传统技术中遇到的限...
  • 本发明涉及卫星通信技术领域,公开了一种窄带卫星语音通信降噪系统及方法,包括预处理模块,用于获取卫星接收端的原始语音信号,对原始语音信号进行预处理,得到预处理后的语音信号;分离模块,用于建立语音分离模型,根据语义分离模型从预处理后的语音信号中...
  • 本发明公开一种实时语音处理方法、装置、设备及存储介质。其中,该方法包括:对各通道的单帧长度数据进行特征提取,得到阵列通道特征;将阵列通道特征送入训练好的U形卷积递归神经网络中,由CNN结构对齐进行特征提取和编码处理得到中间特征,将中间特征与...
  • 本公开是关于一种语音除噪方法及装置、电子设备、存储介质。其中,该方法,包括:将待处理语音信号分别提供至子带处理模块和全带处理模块,以由所述子带处理模块提取基于所述待处理语音信号拆分得到的各个子带信号的子带特征、由所述全带处理模块提取所述待处...
  • 本发明涉及音频处理技术领域,具体涉及一种面向多源噪声环境下的用户输入音频低失真处理方法。本发明根据每个频率下的声源导向矢量和每一时间帧的频率观测列向量,获得每个频率下每一时刻帧的叠加基准信号和差分基准信号;对于任一频率下,根据叠加基准信号和...
  • 本发明提供一种基于人工智能的智能语音识别系统,涉及人工智能技术领域,包括,S1.信号预处理模块,用于接收原始语音信号;S2.语音分离模块,用于处理输入信号中的重叠语音信号;S3.特征提取与识别模块,用于从分离后的语音信号中提取语音特征并进行...
  • 本申请公开了一种啸叫抑制方法、电子设备和计算机可读存储介质,该方法包括:获取输入音频,确定输入音频的初始音频特征,利用参考音频特征调整初始音频特征,得到调整音频特征;其中,参考音频特征是基于叠加有反馈音频的样本音频得到的,反馈音频包括至少播...
  • 本公开提供一种彩铃图像生成方法、装置、设备及存储介质,涉及人工智能技术领域。在本公开的一些实施例中,获取每首歌曲的目标歌曲片段对应的目标歌词文本以及每首歌曲的预设标签、情感类别标签和文本标签;生成每首歌曲的预提示词;将预提示词输入大语言模型...
  • 本发明公开了一种基于大模型的数字人实时交互及视频生成方法,包括:S1、用户音频输入:接收用户输入的连续音频流,使用语音识别模型将连续音频流转录成文字序列;S2、将所述文字序列生成语义连贯的回复文本;S3、并行执行以下操作:(a) 通过语音合...
  • 本申请涉及人工智能技术领域,尤其涉及一种音乐版权识别方法、系统、设备及存储介质。其中,音乐版权识别方法包括:对音频信号进行分段处理并提取音频频谱特征、节奏与节拍特征、旋律轮廓特征、时域与频域统计特征,得到多维音频特征;利用训练好的基于CNN...
技术分类