Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及崩岗识别方法技术领域, 具体地说, 涉及基于坐标注意力机制的无人机影像崩岗智能识别方法。其包括无人机影像采集与预处理模块、CA‑Unet模型构建模块、坐标注意力计算模块和崩岗智能识别输出模块。该方法通过无人机采集高分辨率影像和激光...
  • 本申请涉及图像处理技术领域, 提出了利用遥感图像分析的垃圾填埋场修复效果检测方法, 包括:采集垃圾填埋场修复效果的待检测区域的基准红外图像、配准的可见光图像和红外图像, 识别可见光图像中的排水沟区域;确定像素点的纹理方向偏移量和校正纹理方向...
  • 本申请一些实施例提供一种显示设备和健身跟练纠错方法。用户指示健身跟练后, 显示设备显示健身跟练视频, 并通过图像采集器获取用户图像。显示设备获取动作组数据, 包括多帧动作图像的第一肢体关键点数据和目标肢体区域。显示设备比对当前帧用户图像和多...
  • 本申请公开了一种视频情感识别方法、智能座舱、装置及设备, 视频情感识别方法包括:获取待识别视频数据;对待识别视频数据进行特征提取处理, 得到图像特征和音频特征;将图像特征和音频特征进行联合, 得到联合特征;基于联合特征进行情感识别, 得到情...
  • 本发明公开了基于深度学习的视频内容语义理解与文本描述生成方法, 涉及多媒体信息处理技术领域, 本发明通过CLIP模型计算文本与视频帧的语义相似度, 选取相关关键帧并聚合特征;分别提取音频、视觉和语义特征;利用自注意力对齐不同模态特征, LS...
  • 本公开提供了视频生成模型的训练方法、视频生成方法和装置, 涉及人工智能技术领域, 尤其涉及计算机视觉、深度学习、大模型等技术领域, 可应用于基于人工智能的内容生成等场景。具体实现方案为:对预训练的第一模型进行结构改造, 以得到第二模型, 并...
  • 本发明涉及安全检测技术领域, 具体涉及一种复杂环境下个体特征及行为识别方法, 通过视频流信息处理技术获得多路摄像头实时视频数据流并进行处理;读取预先的摄像头图像划分区域标注位点的文本, 获得每个摄像头的划分区域图像;利用轻量化检测模型检测划...
  • 本发明公开了一种视频事实与观点的对齐溯源方法, 涉及信息检索与验证技术领域, 包括, 使用计算机视觉技术对视频进行帧分析, 提取视频中的场景、对象、动态特征和背景信息, 利用语音识别技术从视频中提取音频, 将音频转化为文本信息, 利用事件抽...
  • 本公开提供了场景生成方法、装置、设备以及存储介质, 涉及人工智能领域, 尤其涉及计算机视觉、深度学习、大模型等技术领域, 可应用于基于人工智能的内容生成场景。具体实现方案为:将目标场景的二维图转换得到该目标场景的三维点云;基于该目标场景的三...
  • 本公开提供了一种球类运动分析方法、装置、电子设备及存储介质, 涉及人工智能技术领域, 尤其涉及计算机视觉、深度神经网络和运动分析技术领域。具体实现方案为:响应于进入发球环节, 基于采集得到的球类运动视频, 拟合得到球体的运动轨迹;基于运动轨...
  • 本发明涉及图片识别方法技术领域, 具体涉及一种异常图片自动识别方法, 包括:从面向对象存储中批量读取监控视频文件, 对视频文件进行分布式抽帧;对抽帧后的图片进行分层抽样, 组成全是正样本的训练集训练PatchCore模型;确定异常得分阈值,...
  • 本申请公开了一种视频融合处理方法、系统、电子设备及存储介质, 涉及视频处理技术领域, 旨在解决对石油石化场站进行监控的效率较低、准确度较差的问题。包括:获取石油石化场站内通过多个视频监控设备采集到的多个视频图像;基于改进的计算机视觉特征提取...
  • 本发明涉及人工智能领域, 可应用于金融科技、医疗健康等业务系统平台中, 公开了基于动态多模态的视频理解方法、装置、设备及介质, 包括:获取待理解的视频数据;对视频数据进行视觉编码处理, 得到相应的视觉特征;对视频数据进行非视觉的多模态编码处...
  • 本发明公开了一种基于深度学习的结晶器保护渣覆盖状态识别的方法, 包括以下步骤:S1、通过实验手段获取保护渣异常覆盖的图像数据, 并对图像进行预处理和标注, 构建训练数据集;S2、构建保护渣覆盖状态识别模型;S3、基于所述训练数据集对所述模型...
  • 本发明涉及计算机视觉技术领域, 可运用于医疗领域和金融科技领域, 公开了基于动态强化学习的关键帧提取方法、装置、设备及介质, 应用于电子应用于高频交易异常行为监控场景中, 或可应用于医疗手术关键帧提取场景中, 其中方法包括:获取原始视频流并...
  • 本发明涉及人工智能技术领域, 可运用于医疗领域和金融科技领域, 公开了多模态视频特征提取方法、装置、设备及存储介质, 应用于金融单据自动化处理场景中, 或可应用于医学影像辅助诊断场景中, 其中方法包括:获取初始多模态数据, 对其进行预处理,...
  • 本发明提供一种基于视觉语言模型的自动化动作轨迹标注系统及方法, 涉及视觉技术模型领域。该基于视觉语言模型的自动化动作轨迹标注系统, 包括关键帧提取模块、VLM语义标注模块、历史标注数据库、扩散模型优化模块和反思修正模块, 所述关键帧提取模块...
  • 本发明涉及人工智能技术领域, 应用于智慧医疗和金融领域, 公开了一种视频理解文本生成方法、装置、计算机设备及存储介质, 包括:根据预设时间间隔于输入视频中提取关键帧, 获得对应的关键帧单帧图像;提取关键帧单帧图像的时空特征;动态计算各时间步...
  • 本发明公开了一种基于动态卷积核的内容伪造检测方法、装置、设备及介质。所述方法包括:提取待检测视频的视频帧, 获取帧序列;将所述帧序列通过预设提取网络进行特征提取, 获取每个视频帧对应的域特征向量;通过预设动态核生成网络根据所述域特征向量生成...
  • 本发明公开了一种基于多尺度图像检索的隧道病害定位处理方法、系统及平台;本发明通过方法基于多尺度图像检索处理, 分别生成并获取与待隧道病害定位处理相对应的第一数据和第二数据;并基于第一数据和第二数据生成相对应的第三数据;其中, 第一数据为当前...
技术分类