Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开的实施例涉及语音合成方法、装置、设备和存储介质。在此提出的方法包括:基于目标文本和提示语音内容,构建与序列模板对应的输入序列,序列模板包括占位符,输入序列中与占位符对应的序列片段为:独立于提示语音内容的预设内容,或,基于提示语音内容生...
  • 本公开的实施例提供基于音色融合的语音合成方法、装置、设备和可读介质。该方法包括:利用第一模型生成与目标文本对应的语音令牌序列;通过融合与多个音色对应的多个音色特征表示,确定融合音色特征表示;利用第二模型处理语音令牌序列和融合音色特征表示,生...
  • 本说明书实施例提供了视频处理方法及装置,其中,一种视频处理方法包括:在视频文件的音频和视频的基础上,通过对音频进行语音识别处理获得语音文本,并根据视频的字幕文本对语音文本进行校正处理获得校正语音文本,进一步将视频和校正语音文本输入多模态模型...
  • 本申请公开了一种语音转换方法以及装置,方法包括:将帧级声学特征序列与音素级文本特征序列对齐,以生成关注内容信息的音素级声学特征序列;基于音素级文本特征序列、音素级声学特征序列、目标对象标识,生成同时携带内容和声学信息的音素级隐变量序列;将音...
  • 本发明公开了一种基于语音声学特征调控的多模态语音交互大模型训练方法、系统、终端设备及介质,涉及多模态语音交互技术领域,所述方法包括:获取文本训练样本的文本token并构造对应的语音token,得到用于将文本token转化为语音token的预...
  • 本发明提供了一种苏州方言医疗语音电子病历转换系统及方法,包括:声学特征提取模块,用于提取输入语音信号的声学特征;方言声调识别模块,用于识别苏州方言的多声调体系;浊音处理模块,用于检测苏州方言中的浊音声母并进行声学特征映射;医疗术语映射模块,...
  • 本说明书涉及大语言模型技术领域,提供了一种评估模型的偏差识别方法、训练方法、评分方法及设备;偏差识别方法中,输入至评估模型的数据包含:待评分内容以及评分辅助信息,评估模型在评分辅助信息的提示下,输出待评分内容的评分分数;方法包括:对预设的原...
  • 本公开的实施例提供了处理语音内容的方法、装置、设备和存储介质。该方法包括:从目标语音内容中确定与目标对象相关联的第一语音内容,第一语音内容对应于第一文本;生成与第一文本对应的第二文本,第一文本对应于第一语言,第二文本对应于第二语言;基于目标...
  • 本申请提供了一种基于大模型和RAG的语音交互智能知识检索方法,涉及智能知识检索技术领域,包括:将原始数据进行清洗,并分割成多个知识片段,通过文本嵌入模型将每个知识片段转换成向量,以构成向量数据库;基于预设的唤醒词触发音频采集,以将用户语音输...
  • 一种通过使用用户的话语频率数据来理解用户意图的方法和装置。本公开的一方面提供了一种使用用户的话语频率数据来理解话语意图的方法,该方法包括:在输入用户话语之前检查前一屏幕的屏幕ID;从话语频率数据中获取每个屏幕ID的话语数量;当每个屏幕ID的...
  • 本发明提供一种核应急医学救援智能语音辅助系统,涉及自然语音处理技术领域。该系统包括:语音识别模块,用于对核应急医学教学场景中的声波信号进行角色分离和片段重组,得到多个语音信号;其中,每个语音信号对应一个发言角色;语音检索模块,用于基于系统知...
  • 本申请实施例提供了一种用户意图的识别方法、装置、电子设备及可读介质,获取预设的用户对预设的待控制家居设备的语音指令,并采集待控制家居设备周围环境的环境参数、用户在环境中的用户位置信息以及当前时间中的至少一个;基于语音指令、环境参数、用户位置...
  • 本申请提供了一种语音控制方法、装置、电子设备及存储介质,涉及智能家居技术领域。方法包括:获取用户的待识别语音信号;将待识别语音信号输入至指令简化模型中,得到指令简化模型输出的目标控制指令;指令简化模型包括语音识别模型和语言简化模型,语音识别...
  • 本发明公开了一种车机控制方法、装置、设备及介质,其中,方法包括:获取用户语音数据,并对用户语音数据进行语音识别得到语音识别结果;在识别到用户语音数据对应的第一个有效字符时对当前页面进行截图操作,得到截图图片;基于截图图片和语音识别结果生成操...
  • 本申请涉及一种语音识别系统及其语音识别方法、电子设备及可读介质。该系统包括:中控设备,用于通过内置麦克风采集用户语音,执行意图识别引擎识别出的设备控制指令;语音识别引擎,用于接收并识别麦克风采集的用户语音,输出语音识别结果;意图识别引擎,用...
  • 本发明提供一种基于人工智能的场景联动音箱控制系统及方法,涉及音箱控制技术领域。包括:数据采集模块,采集用户语音指令和环境数据;数据预处理模块,对语音指令和环境数据进行预处理,得到预处理语境数据;人工智能处理模块,运用自然语言处理算法对预处理...
  • 本申请公开了一种车辆语音交互控制方法、装置、设备及存储介质,接收目标车辆的驾乘人员的第一语音数据;其中,第一语音数据用于调整目标车辆的应用场景,每个应用场景对应一组目标车辆中的若干执行器的动作参数;对第一语音数据进行解析,根据解析的结果从预...
  • 本申请实施例公开一种语音识别处理方法及装置,该方法包括:对车辆接收的当前轮次的第一语音请求进行预处理,获得第一文本;若第一文本满足修正前置条件,获取上一轮次的第二语音请求,对第二语音请求进行预处理,获得第二文本;根据第一文本和第二文本,检测...
  • 本公开涉及一种语音控制方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:通过第一语音处理系统接收麦克风模拟语音信号;第一语音处理系统为预设指令型语音处理系统;通过第一语音处理系统识别所述麦克风模拟语音信号,得到用户语音指令;通...
  • 本申请实施例公开了一种语音交互方法及装置、设备、存储介质,该方法应用于车载终端,包括:获取车载终端采集的音频信号;基于音频信号确定目标提示词,根据目标提示词得到音频信号的类型,音频信号的类型包括:可执行指令音频信号;在音频信号为可执行指令音...
技术分类