Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明公开了一种基于深度学习的有声书韵律语音合成方法,首先,通过说话人编码器模块,提取参考音频的音频特征;其次,将待合成音频文本传入编码器和时长预测器并融合参考音频特征得到音频编码;接着通过韵律预测器和解码器输出合成音频频谱;最后,通过声码...
  • 本申请提供一种语音通信方法、语音通信装置、语音通信系统、计算设备和计算机可读存储介质。方法包括:接收来自发送端设备的发送方的语音信息和语音信息被实时转换成的文字信息,并向接收方播放语音信息;判断是否发生通信异常;若是,将发生通信异常的时段所...
  • 本发明涉及一种基于多源数据的评价方法、电子设备及可读储存介质;所述多源数据包括结构化数据、非结构化数据和实时物联数据,所述方法具体包括:S1、所述结构化数据、非结构化数据和实时物联数据均包括数值评价和非数值评价;S2、根据结构化数据、非结构...
  • 本发明提供了一种多系统协同的物流监管方法、航空物流货站及相关设备,该方法应用于航空物流货站的货站管理系统,包括:获取目标货物的目标货物信息,并将目标货物信息同步给航空物流货站中的所有系统;实时获取来自海关监管系统针对目标货物信息生成的海关状...
  • 本发明公开了一种燃气管道改装施工项目资源配置优化方法及系统,涉及资源配置优化相关技术领域,所述方法包括:读取燃气管道改装施工项目的多个预设施工区域和预设施工方案;分别进行施工资源需求预测,生成多个预测施工资源;连接燃气管道施工平台,读取非消...
  • 本申请公开的属于领域驱动设计、paas平台、业务中台技术领域,具体为一种领域模型流程构建的方法,包括产品愿景分析、业务流程图、业务关键节点分析、业务规则分析、指令参数分析、抽取领域对象、确定聚合根、优化聚合根、构件视图、反推、数据模型设计、...
  • 本申请涉及一种申请信息的处理方法、装置、设备和可读存储介质。所述方法包括:配置风险预警信息,并获取目标对象的申请信息;在申请信息包括风险预警信息中的至少一个预警对象时,从风险预警信息中确定预警对象的预警级别;基于预警对象和预警级别,从预先配...
  • 本发明公开了一种数字业务管理平台的数据采集方法及系统,涉及数据采集技术领域。该方法包括:根据工作需求获取数据需求并进行审核以生成数据采集指标;确定数据源并进行类型划分获得数据源类型;生成数据采集策略和数据采集任务;进行数据采集以获得多源数据...
  • 本申请提供了一种语音识别方法、装置及电子设备,获取待识别的原始音频后,对原始音频进行语音活动检测,确定原始音频被分割的各个第一音频段和各个第二音频段;第一音频段和第二音频段是基于是否包含语音的不同检测结果分割得到;提取各个第一音频段和各个第...
  • 本公开涉及医学影像智能处理技术领域,提供了基于人工智能的医学影像分割方法、系统和电子设备。该方法包括:获取医学CT影像数据;对医学CT影像数据进行格式转换,获得标准格式的医学CT影像数据;对标准格式的医学CT影像数据进行预处理;对预处理后的...
  • 提供了一种基于小样本学习的多域声学特征融合的伪造音频鉴别方法和计算装置。所述方法包括:获取待鉴别音频,并对所述待鉴别音频进行预处理;从经预处理的待鉴别音频中提取梅尔频率倒谱系数、梅尔频谱图和音高;将梅尔频率倒谱系数、梅尔频谱图和音高进行融合...
  • 本发明涉及声纹识别技术领域,具体提供了一种声纹识别与语音合成结合的智能对话方法,包括步骤:实时获取用户语音输入信号;对语音输入信号进行声纹特征提取,获得包含用户身份特征和韵律特征的复合声纹向量;基于复合声纹向量进行用户身份匹配,并关联调用动...
  • 本发明公开了一种高定位精度的无人机‑遥感影像跨视角地理定位方法,通过构建特征空间分组增强的无人机‑遥感影像跨视角地理定位模型,基于ConvNeXt提取无人机和遥感影像的多尺度语义特征,得到全局特征和局部特征;将经特征空间分组增强模块空间增强...
  • 本发明涉及一种多尺度融合的点云特征提取与自适应匹配方法,本发明采集、滤波,体素化处理点云;确定点云中每个点的法向量;根据点云点的法向量进行有效特征点筛选;对保留的有效特征点进行多尺度特征计算,并进行特征点二次筛除;对第二次筛选有效特征点进行...
  • 本发明涉及鱼类识别技术领域,本申请提供一种基于YOLO模型的水下鱼类目标的识别方法、装置、设备及存储介质,所述方法获取鱼类目标图像,对所述鱼类目标图像进行图像优化,得到第一图像;基于预训练的所述YOLO模型对所述第一图像进行处理,得到水下鱼...
  • 本申请公开了一种音频的修音方法、装置、设备、介质、产品,包括如下步骤:获取第一账号针对第一多媒体作品的人声音频,人声音频中包括至少两个音频分段;获取至少两个音频分段分别对应的音频质量;从至少两个音频分段中获取音频质量符合预设质量要求的至少一...
  • 本发明提供一种基于特征交互和多模态数据融合的开放词汇语义分割方法和装置。采用冻结参数的SAM编码器并行提取RGB图像与Mask图像特征,并通过特征融合模块进行边界信息增强。利用冻结参数的CLIP图像编码器对RGB图像进行多层特征提取,并通过...
  • 本申请公开了一种多发言者识别方法、装置、设备及存储介质,涉及语音处理技术领域,包括:基于多通道麦克风阵列和预设声源定位算法确定当前声源信息对应的空间状态序列,并利用预设门控机制对当前声源进行语音段落的分割,利用预设稳定窗口重检测机制对得到的...
  • 本公开的实施例提供了人体姿态估计方法、装置、设备以及存储介质,应用于人工智能技术领域。所述方法包括获取待估计人体姿态图像和对应的图像编号;对图像编号和预设间隔步数进行取模运算;若余值不为零,则采用ByteTrack跟踪器预测框作为目标裁剪框...
  • 本发明公开一种水工结构水下缺陷声‑光成像语义融合检测方法,针对水工结构水下缺陷,通过水下声‑光成像传感同时获取水工结构水下声学和光学图像;在此基础上,通过语义特征提取模块提取声学图像中的声学语义特征,以声学语义特征为引导对光学图像中光学图像...
技术分类