Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开实施例提供了一种语音处理方法、装置、电子设备以及存储介质。该方法包括:确定待处理语音信息对应的待处理语音特征信息,所述待处理语音特征信息是通过对目标语音识别模型的编码器从所述待处理语音信息中提取的语音特征信息所包括的冗余音色特征信息进...
  • 本公开提供一种说话人识别的方法及装置、电子设备和存储介质,该说话人识别的方法包括:获取第一通信记录;根据第一通信记录,确定第一视频会议的候选参会人员集合,该候选参会人员集合包括多个候选参会人员;根据第一视频会议的音频数据和候选参会人员集合中...
  • 本发明涉及人工智能技术领域,可应用于金融科技和医疗健康领域,公开了一种基于声纹识别的反欺诈方法、装置、设备及介质,方法包括:获取通话语音信号,并对所述通话语音信号进行处理得到多维度声纹特征;将所述多维度声纹特征输入深度学习模型中进行优化得到...
  • 本申请公开了一种音频信号处理装置、方法、设备、介质及产品。上述装置包括:存储模块、数字信号处理器DSP芯片和人工智能AI芯片;DSP芯片,被配置为接收音频信号;执行对音频信号的预处理,得到第一音频数据;向AI芯片发送控制指令,控制指令用于控...
  • 本发明提供了一种基于多模态输入的语音生成方法及相关设备,方法包括接收多模态输入数据及辅助输入数据并输入多模态数据管理器进行融合处理及提取关联特征得到多模态融合特征;将多模态融合特征输入上下文状态建模器、状态和行为控制器、语音生成策略引擎、平...
  • 本申请公开一种基于大模型的变量提取方法及相关设备,包括:云端接收机器人上传的录音数据以生成待处理录音数据;将待处理录音数据输入语言大模型获取第一文字信息,语言大模型被配置为:对待处理录音数据进行句子拆分得到多个音频数据,对待处理录音数据进行...
  • 本公开提供了一种语音识别方法,所述方法应用于计算装置内,所述计算装置包括:DMA单元和运算单元;所述方法包括如下步骤:通过DMA单元获取用户输入的待识别语音;运算单元调用运算指令对所述待识别语音进行语音识别处理,从而获得所述待识别语音所对应...
  • 本申请实施例提供了一种车辆的语音处理方法、车辆及计算机可读存储介质,涉及车辆技术、语音处理技术领域,该方法包括:监测车辆的座位乘坐状态,得到监测结果,其中,监测结果用于反映车辆中任一座位上是否有乘坐对象;响应于车辆中第一座位上无乘坐对象,基...
  • 本申请的实施例涉及智能对话生成技术领域,特别涉及一种面向电梯应急救援的基于InterHT模型的智能对话生成方法,包括:基于收集到的电梯应急救援相关的大数据和分析出的业务特性,构建若干个面向电梯应急救援的三元组;基于InterHT模型,为每一...
  • 本发明提供一种基于语义识别的术中需求器械识别方法及系统,涉及数据处理技术领域。方法包括:获取主刀医师的语音信息;将语音信息转换为语句信息;对语句信息进行包括语法纠错的预处理,以消除语句信息的语法错误;构建包括BERT模块、具有规则过滤器单元...
  • 本公开涉及人工智能技术领域,公开一种基于深度学习的语音对话方法、装置、介质及电子设备,该方法包括:提取用户语音信号对应的原始文本信息,并结合长短期记忆网络与注意力机制,生成目标文本信息;对目标文本信息进行深度语义解析,并结合用于语音语义解析...
  • 本申请提供一种文本处理方法、装置、电子设备、存储介质及程序产品,涉及人工智能、自然语言处理、大语言模型、自动驾驶、智慧交通等技术领域。通过确定目标语音的初始语音识别文本和音素数据,基于该初始语音识别文本和音素数据生成目标提示信息;并基于该目...
  • 本发明公开了一种家用智能音响的远程控制方法及系统,属于物联网技术领域。该方法包括以下步骤:构建静态空间拓扑模型;各智能音响设备并行采集各自的语音信号,并同步获取各自的二进制被注视状态标记;执行视线优先的第一级仲裁;若所述第一级仲裁未产生最终...
  • 本发明涉及音视频控制技术领域,公开了基于语音指令的音视频播放器控制方法。该方法包括采集用户的原始语音指令流,此指令流含时域音频信号序列、环境噪声频谱及用户发音特征参数,可全面捕捉语音信息;再对原始语音指令流进行多模态指令解析处理,生成包含声...
  • 本申请公开了一种语音交互方法、服务器和计算机可读存储介质。方法包括:根据接收到的语音请求的声学特征,确定情绪状态标识,其中,所述声学特征包括音调特征、语速特征及能量特征中的至少之一。根据所述情绪状态标识和所述语音请求,生成情绪适配型垫话,以...
  • 本申请涉及智能化办公技术领域,尤其涉及一种多模态办公助理系统,该系统包括:语音唤醒模块,其基于第一多模态数据,进行唤醒概率预测,得到唤醒概率预测值;若唤醒概率预测值大于唤醒阈值,则进行多模态办公助理系统唤醒,唤醒阈值与当前的环境噪声强度呈正...
  • 本申请公开了一种语音交互方法、装置、计算机程序产品以及电子设备。涉及人工智能领域,该方法包括:接收目标用户发送的语音信息,并对语音信息进行识别,得到第一文本内容;通过大语言模型生成第一文本内容的回复文本,得到第二文本内容;获取目标用户的用户...
  • 本申请实施例提供了一种个性化语音交互方法和相关设备,属于智能语音交互技术领域。该方法包括响应于语音交互服务请求,采用流式处理技术接收对象提问音频流;对对象提问音频流进行分割操作和预处理操作,得到对象提问音频片段;对对象提问音频片段进行对象特...
  • 本发明公开了公开了一种基于端到端模型的语音隐私泄露检测与脱敏系统及方法,属于语音识别与隐私保护领域。解决了语义脱敏不彻底、声纹保护效果差、缺乏全流程审计的问题。技术原理部分,发明包含语音识别、语义脱敏、声纹脱敏及日志审计模块,输入原始音频,...
  • 本申请实施例提供了一种语音答复方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和医疗领域。该方法包括:获取目标对象的原始语音;对原始语音进行意图识别,得到目标对象的请求意图;对原始语音进行情绪识别,得到请求情绪类型;...
技术分类