Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种提供陪伴机器人的多模态思念情感识别分析与智能互动系统及其方法,通过陪伴机器人与情绪分析服务器,整合摄影机与麦克风取得年长者的生活影片与语音,利用人工智能进行场景、视线、表情及语音的多模态分析,精确识别思念情绪。系统基于场景信息与怀念对象...
  • 本发明公开了一种基于声纹角色分离与安全指令自动仲裁的方法及系统,所述方法包括采集设备获取用户的语音信号,并对语音数据进行预处理;声纹特征提取,将时域信号转换为频域信号;将声纹特征提取后的模型进行深度神经网络训练;使用全连接神经网络进行角色识...
  • 本发明涉及一种基于视觉和大模型的仿真数字人实时智能语音交互系统及其方法,旨在解决复杂场景下数字人语音交互中目标说话人识别不精准、响应延迟高等问题。系统通过摄像头圈画有效识别范围,结合人脸检测触发音频采集,利用唇动识别、声像融合技术锁定目标说...
  • 本说明书实施例公开了一种基于主动汇报的驾驶机组状态识别方法,所述方法包括:采集特定范围内的语音信息,从所述特定范围内的语音信息中识别出目标语音信息;其中,所述目标语音信息为驾驶机组的语音信息;使用语音识别模型对所述目标语音信息进行关键词检测...
  • 本发明提供AI玩具陪伴机器人的语音数据实时控制方法及系统,涉及自动语音识别技术领域,所述方法包括:步骤1,采集用户语音指令,获取语音特征序列;步骤2,将语音特征序列输入AI的端对端语音识别模型进行流式初步解码,生成候选文本序列,并对候选文本...
  • 本发明公开了一种基于用户画像的老人陪伴智能对话方法及系统,涉及智能交互技术领域,包括基于多模态数据计算用户特征,拼接为用户画像向量,将语音生成帧序列,计算交互特征向量,构建交互序列,生成前缀树,提取所有路径,计算支持度,生成候选模式集;提取...
  • 本发明涉及一种基于高效语料筛选的实时标点恢复方法。本发明首先下载多个开源的中文纠错语料数据集,将数据清洗,并将标点去除,从而构建模拟的语音识别结果;然后利用多种语料用不同的方法混合形成多种数据集并进行数据加权;最后对比多个数据集的预测结果的...
  • 本公开实施例提供了一种数据处理方法、装置、介质、程序产品和机器人系统,涉及机器人技术领域。其中,该数据处理方法包括:获取机器人的音频接收器采集的第一音频输入数据;在确定第一音频输入数据中存在生物语音信息的情况下,对该第一音频输入数据进行处理...
  • 本公开的实施例涉及语音识别的方法、装置、设备和存储介质。在此提出的方法包括:将获取的语音数据的响度调整至预设的响度范围,语音数据来自与构音障碍相关的对象;从语音数据中提取与语音活动相关联的至少一个语音片段;向模型提供至少一个语音片段的音频特...
  • 本发明公开了一种基于多轮上下文补全的陆空通话智能监控方法,包括:步骤1:接收来自内话系统的陆空通话片段,进行语音识别;步骤2:对转录文本进行实体抽取,形成第一指令结构体;步骤3:提取陆空通话片段的声纹特征,结合实体抽取结果与陆空通话规则,判...
  • 本申请公开了一种基于声纹信息的设备唤醒方法、装置、设备和可读存储介质,涉及声纹识别技术领域。包括:实时采集声音信号,并根据所述声音信号的短时能量和过零率判断所述声音信号中是否存在语音信号;若所述声音信号中存在语音信号,则判断所述语音信号是否...
  • 本申请提供了一种语音修复模型的训练方法、语音修复的方法和装置,涉及语音技术领域。该方法应用于电子设备,包括:在原始语音数据中存在受损语音数据的情况下,获取受损语音数据的受损描述信息;其中,受损描述信息用于表示受损语音数据受损的原因;基于受损...
  • 本发明涉及一种一体化语音定向采集与识别系统,属于语音识别领域。本发明的系统可以通过在前端语音增强模块中同时使用阵列定向采集技术和声纹识别技术实现对指定关键人员语音信息的提取,后端语音识别模块通过提取到的音频信息可以区分并识别多个人的语音,前...
  • 本申请涉及一种基于多维状态感知的智能音箱响应方法及系统,该方法包括接收用户的语音输入信号,基于语音输入信号采集多维状态信息,对多维状态信息进行多维状态感知处理,得到结构化状态数据,多维状态感知处理包括用户身份识别、情绪状态量化和环境状态特征...
  • 本发明涉及数字音频水印技术领域,特别是涉及一种视频会议实时音频防篡改水印检测方法及装置。所述视频会议实时音频防篡改水印检测方法,包括:将音频信号等分为多个音频帧,每帧分为两个子帧并进行DCT;选取中频频段,通过修改所述子帧中频系数的奇异值关...
  • 本发明涉及一种无线音频数据传输方法、装置、存储介质和电子设备,方法包括:依据预先设置的第一编码速率及第二编码速率分别对相同的音频数据帧进行编码得到第一编码速率数据流及第二编码速率数据流,其中第一编码速率高于第二编码速率;发送第一类型的一个或...
  • 本发明提供一种基于时域分析的二元自然语音分割方法与系统。该方法包括:获取目标二元自然语音文件并生成对应的二元自然语音数据;对所述二元自然语音数据进行逐码元分析,根据当前码元与其相邻码元之间的时间间隔与预设时间间隔系数的关系,识别当前码元是否...
  • 本申请实施例公开了语音处理方法、装置、电子设备和存储介质。对原始待处理的第一媒体流数据进行语音特征提取和语音内容提取,得到第一媒体流数据中跟语言表达的相关的语音特征信息和语音内容信息,然后在提取到的语音特征信息和语音内容信息的基础上,生成新...
  • 本申请公开了一种啸叫抑制方法、装置、设备及可读存储介质,电子设备利用第一啸叫数据库中的样本啸叫信号训练初始模型,以得到第一神经网络模型。之后,电子设备利用第一神经网络模型生成增广信号,将增广信号添加在第一数据库中以得到第二啸叫数据库,并利用...
  • 本申请实施例提供一种啸叫抑制方法、装置、设备及可读存储介质,电子设备上部署预先训练好的神经网络模型,该神经网络模型包含串联的第一阶段模型和第二阶段模型。电子设备获得第一语音信号后,利用串联的第一阶段模型和第二阶段模型依次对第一语音信号进行啸...
技术分类