Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种基于物理引导网络的毫米波雷达语音重建与识别方法,包括:使用毫米波雷达对待测目标发射射频信号并接收回波信号,同时采集参考音频信号;根据回波信号提取稳相信号梅尔谱;通过对参考音频信号和公共语音数据集进行音频信号模拟生成模拟雷达梅尔谱;对稳相...
  • 本发明公开了一种基于个性化声纹训练的自适应鼾声抵消方法、装置及病友专用睡眠耳塞,属于智能降噪与睡眠辅助技术领域,旨在解决病房内打鼾干扰病友睡眠的问题。本发明包括个性化训练和实时识别抵消两阶段,训练阶段采集病房打鼾病友鼾声音频,提取声学特征经...
  • 本发明公开了一种基于声纹白名单的端侧预筛选与端云协同校验的语音生成方法、系统、设备、介质及程序产品,涉及声纹识别与音频流控制技术领域。该方法包括:通过录音设备端,对输入音频进行语音活动检测,得到候选语音段;根据各第一声纹模板,对候选语音段进...
  • 本发明公开了一种用户语音状态判断及处理方法、系统和电子设备。该方法包括:采集用户方音频数据;判断用户是否处于发言状态;将用户方音频数据转换为文本数据;对文本数据实现完成/未完成/等待三分类后分别进行处理,突破传统二分类局限,区分真实结束发言...
  • 本发明涉及智能语音交互技术领域,具体为一种用于软件的集成语音识别技术的智能交互系统,包括:语音处理模块、特征提取模块、语音识别模块、结果优化模块、语义解析模块和交互执行模块。该系统接收原始语音信号,经预处理和特征提取后,由语音识别模块生成多...
  • 本申请涉及一种设备唤醒方法、装置、计算机设备和存储介质。所述方法包括:响应于目标终端采集到语音信号,根据不同切片分词和每一切片分词的分词权重,对语音信号进行语音识别处理,得到识别结果;其中,不同切片分词是对自定义唤醒词进行切片拆解得到的;响...
  • 本发明公开了一种基于智能电子工牌的语音质检方法、系统、设备及介质,涉及语音质检技术领域。该方法通过物联网平台下发含业务工单标识的远程控制指令,智能电子工牌响应并采集语音数据切片上传,拼接形成完整语音服务文件;并处理生成带说话人标签的对话文本...
  • 本申请公开一种语音转写处理方法、装置、设备及程序产品。方案包括:获取音频数据。对所述音频数据进行语音转写处理,得到至少两种版本的候选转写文本。对比所述至少两种版本的候选转写文本,识别所述至少两种版本的候选转写文本中存在转写歧义的可疑文本片段...
  • 本申请涉及人工智能助手领域,公开了一种人工智能控制方法及人工智能控制系统,所述方法包括:实时采集车内语音信号,解析语音信号中的唤醒词汇;若解析出的唤醒词汇为本设备唤醒词,则启动唤醒流程;若解析出的唤醒词汇属于非本设备唤醒词集合,则不启动唤醒...
  • 本申请涉及语音处理技术领域及智慧医疗和金融科技领域,提供了一种语音处理方法、装置、电子设备及计算机可读存储介质,方法包括:获取用户语音信号;对语音修正文本进行增强检索生成处理,得到文本检索关键信息,并且对文本检索关键信息进行向量化处理,得到...
  • 本申请提供一种智能化会议纪要生成方法、装置、设备及存储介质,涉及自然语言处理技术领域。本申请方法利用多通道麦克风阵列实现音频的清晰捕捉和准确标识;将带有发言者标识的音频输入到语音识别模型中,转换成带有时间戳的结构化初始纪要文本。通过大语言模...
  • 本发明设计了面向专业演讲的非中文术语实时语音转写纠错方法及系统。首先,基于演讲视频中的幻灯片画面变化将视频分割成连续的时域区间;对每个时域区间内的演讲语音片段,使用流式自动语音识别模型得到原始语音转写文本;同时,从视频流中提取当前页幻灯片中...
  • 本发明设计了面向专业演讲的中文术语实时语音转写纠错方法及系统。首先,基于演讲视频中的幻灯片页面变化将视频流分割成连续的时域区间;对每个时域区间内的演讲语音片段,使用流式自动语音识别模型将其转换为原始语音转写文本,同时从视频流中提取当前页幻灯...
  • 本发明提供一种信息处理系统,包括:基于过往诈骗案例生成用于识别诈骗行为的机器学习模型的手段;用于将来自通信设备的音频数据转换为文本数据的手段;用于将转换后的文本数据输入所述机器学习模型并评估诈骗可能性的手段;用于在评估为存在诈骗可能性时向用...
  • 本发明涉及用于实时改变语言的方法和系统。由包括至少一个处理器的计算设备执行的实时语言改变方法包括基于由用户发出的唤醒词语、车辆的位置或车辆的语言设置中的至少一项来选择候选语言。该方法还包括向服务器发送关于用户的语音发声和候选语言的信息。该方...
  • 本发明提出了基于双智能体实时通信的语音控制浏览器操作方法及系统,涉及人机交互与计算机软件技术领域,针对的问题是:现有技术存在语音与浏览器操作割裂、智能体间协同困难、缺乏实时打断机制及完整会话持久化能力的缺陷。该方法由通过通信桥接器实时连接的...
  • 本发明公开了一种基于AI语音指令的信控闭环执行方法与系统,涉及交通控制相关领域,该方法包括:将语音指令解析为结构化语义约束描述;将结构化语义约束描述嵌入系统状态向量,构建联合状态向量,形成扩展信控状态空间;基于联合状态向量执行信号控制方案的...
  • 本申请涉及一种语音识别方法及装置,该方法包括:获取第一语音信息和当前语音识别场景的场景码;基于第一语音信息,进行关键词检测,得到关键词检测结果;在关键词检测结果达到对应场景码的预设条件的情况下,唤醒语音识别模型,并获取第二语音信息;至少部分...
  • 本发明涉及空管语音标注技术领域,提供一种空中交通管制语音的离线半自动标注方法及系统,方法包括接收空中交通管制场景的原始通话录音;对原始通话录音进行基于静默检测的自适应切分处理,获得多个短音频片段;对短音频片段进行异步流水线式后台批量预识别处...
  • 一种船舶百叶玻璃语音交互与显示协同控制装置及其工作方法,协同控制装置供电单元、控制单元和语音处理单元,语音处理单元包括语音收集模块和语音识别模块,语音识别模块具有降噪和情绪识别功能;还包括显示单元和音响单元,控制单元与语音处理单元、显示单元...
技术分类