Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及语音通信技术领域,公开了一种基于LDSW语音压缩技术的语音通信方法及智能手机,方法包括:LDSW智能手机,通过LDSW智能标签,采用LDSW通信技术标准与其他LDSW智能手机实现不依赖移动网络的低功耗数字通信;当LDSW智能手机之...
  • 本发明涉及蓝牙耳机通信技术领域,公开了基于前向纠错编码的蓝牙耳机抗干扰方法,该方法包括:采集蓝牙音频数据包序列,识别实时传输干扰等级并汇总总干扰量需求;确定基准冗余编码容量,识别候选编码单元在环境干扰参数下的最大纠错能力;基于最大纠错能力与...
  • 本公开的实施例涉及音频编码方法、装置、设备和存储介质。在此提出的方法包括:利用编码模块,将目标音频编码为第一向量表示;基于对与第一向量表示对应的第一分布的采样,确定第二向量表示,第二向量表示满足第一分布;以及通过将第二向量表示转换为满足第二...
  • 本发明涉及语音交互技术领域,尤其涉及一种基于通信控制的语音模块动态配置方法,包括在语音固件程序中预置一个或多个产品型号对应的唤醒词集合和命令词集合;语音模块完成上电启动后,当读取的产品型号数据与型号标识匹配,使能对应产品型号的唤醒词集合与命...
  • 本发明公开了一种基于声纹识别的跨号码用户画像关联及智能对话优化方法,包括:接收并处理用户来电语音流,经语音预处理后进行对抗样本检测,对合规语音用ECAPA‑TDNN模型提取声纹向量;通过FAISS/Milvus检索匹配用户获取user_id...
  • 本发明涉及数据处理领域,具体涉及一种语音识别方法及存储介质,语音识别方法包括:接收用户的语音信息;对所述语音信息进行转化处理,得到文本信息和所述语音信息对应的语音识别置信度;对所述文本信息进行数据处理,得到第一特征数据和第二特征数据;根据所...
  • 本申请提供了一种语音端点检测方法、装置、电子设备及存储介质,涉及音频处理技术领域。方法包括:基于待检测语音信号和所述待检测语音信号关联的视频信号,提取至少两种特征信息,作为多模态特征信息;将所述多模态特征信息进行特征融合,得到融合特征信息;...
  • 本发明的基于多模态融合的OWS蓝牙耳机同声传译方法及系统,涉及胸外科手术智能同声传译与规划技术领域, 方法包括:S1:基于环境音频信号与姿态检测信号形成多模态激活指令;S2 : 响应于多模态激活指令启动视觉传感器,形成增强语音特征信号;S3...
  • 本申请实施例提供了一种模型优化方法、文本生成方法、装置及电子设备。模型优化方法,包括:确定待优化语言模型;获取偏好文本对;偏好文本对中包括:原始文本、偏好译文以及非偏好译文;偏好译文与原始文本之间的音频时长接近程度高于非偏好译文与原始文本之...
  • 本申请公开了一种AI对话空闲状态检测方法、AI对话系统、设备及存储介质。该方法包括:实时采集音频数据并向服务器端上报音频数据;接收服务器端响应音频数据而回复的交互音频包,并读取交互音频包的字节长度;响应于交互音频包的字节长度不超过静默音频包...
  • 本申请涉及一种语音识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,可用于计算机技术领域。该方法包括:通过语音识别系统对语音信号进行语音识别处理,得到初始识别文本;对初始识别文本中的字词进行拼音转换处理,得到第一拼音信息;对第...
  • 本申请公开了一种语音唤醒模型训练方法、语音唤醒方法、设备及介质,涉及人工智能技术领域,方法包括:获取待训练的语音唤醒模型与预设置的目标唤醒词;将目标唤醒词输入至语音合成模型中,输出得到正样本语音数据,生成与正样本语音数据相对的负样本语音数据...
  • 本发明公开了基于多模态融合的智能拾音与语音识别系统,涉及人工智能与语音识别交叉技术领域。系统包括主控制模块、多个拾音节点和多模态融合引擎,其中多模态融合引擎包含声源定位与分离、环境自适应降噪、跨模态特征融合及动态上下文理解四个核心组件。通过...
  • 本发明涉及语音数据处理技术领域,公开了一种基于语音意图追踪微代理的多业务语音导航方法及装置。实施本发明,通过对语音导航请求进行语音识别得到识别文本,再分别进行意图识别和关键词提取,能够准确把握用户语音请求中的核心意图和关键信息,有利于提高语...
  • 本发明提供了基于多模型动态互验的语音交互方法、装置及电子设备,涉及人工智能语音交互技术领域,包括:获取用户语音数据;将所述用户语音数据输入至语音识别模型,得到带标点的中文文本及其对应的时间戳;对所述中文文本进行解析,通过熵值计算模型得到语义...
  • 本发明涉及语音识别与智能家电控制技术领域,尤其涉及基于语音识别的电磁炉控制方法,包括:同步采集语音信号与唇部运动信号,经时戳对齐生成多模态感知数据;对数据进行跨模态抗噪处理,输出融合声学及视觉特征的融合特征张量;执行语义解析与危险指令识别,...
  • 本发明提供一种分布式语音互动模块系统,包含至少一语音互动单元与一中央语意事件协调单元。每一语音互动单元具备语音唤醒、语音识别(ASR)、自然语言理解(NLU)、语音合成(TTS)与短期记忆功能,能独立处理用户语音输入,并生成语意事件上传。中...
  • 本申请实施例公开了一种语音交互方法及装置、设备、存储介质,该方法应用于车载终端,包括:获取车载终端采集的音频信号;基于音频信号确定目标提示词,根据目标提示词得到音频信号的类型,音频信号的类型包括:可执行指令音频信号;在音频信号为可执行指令音...
  • 本公开涉及一种语音控制方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:通过第一语音处理系统接收麦克风模拟语音信号;第一语音处理系统为预设指令型语音处理系统;通过第一语音处理系统识别所述麦克风模拟语音信号,得到用户语音指令;通...
  • 本申请实施例公开一种语音识别处理方法及装置,该方法包括:对车辆接收的当前轮次的第一语音请求进行预处理,获得第一文本;若第一文本满足修正前置条件,获取上一轮次的第二语音请求,对第二语音请求进行预处理,获得第二文本;根据第一文本和第二文本,检测...
技术分类