Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于MLLM的视频生成评估方法及系统,涉及计算机视觉与自然语言处理交叉的多模态评估技术领域,包括:步骤1、接收待评估的视频数据和对应的文本提示;步骤2、对视频数据进行预处理,提取关键帧序列;步骤3、利用MLLM将关键帧序列转...
  • 本申请涉及自动化监测技术领域,尤其涉及一种基于相位放大的钢轨振动监控方法,包括:获取钢轨连续的视频流并进行预处理,得到待处理视频帧;基于待处理视频帧,利用预先构造的方向可调滤波模型进行多尺度、多方向的分解,获取不同方向子带的图像;基于不同方...
  • 本发明提供一种铁路弱光环境下天窗作业限界识别与超限检测预警方法及系统,属于目标识别技术领域。本发明实现了高精度轨道限界识别:在弯道、道岔等复杂几何区域仍能保持分割边界的连续性与准确性;实现了强鲁棒性的弱光目标检测:通过图像增强与多尺度特征融...
  • 本发明公开了一种基于语义分割的视频监控场景智能解析与事件分类系统,所述系统包括:数据预处理模块、初步分类模块、权重生成模块、修正与检测模块;数据预处理模块,用于获取视频监控场景的原始视频数据并进行预处理,且通过语义分割模型提取预处理后视频数...
  • 本发明公开了一种无需关键点与三维重建的视频面部塑形方法及装置。其中,所述方法包括:获取输入视频序列、从所述输入视频序列中选取的参考图像、以及与所述参考图像对应的目标面部塑形流场图;将所述输入视频序列编码至潜在空间,得到视频潜在特征序列;构建...
  • 本发明实施例公开了一种基于移动终端的巡检方法及移动终端背夹、电子设备、存储介质,该巡检方法包括:获取步骤:获取移动终端发送的目标对象的视频流,视频流包括多帧图像;确定步骤:根据预设周期从视频流中抽取多帧图像,每个周期内抽取的多帧图像包括第一...
  • 本发明公开了一种基于多模态混合专家模型的步态情绪识别方法,包括:采集与标注不同情绪行人走路视频数据;处理视频数据,提取人体运动骨架数据,获得第一目标数据;处理视频数据,提取人体运动轮廓数据,获得第二目标数据;对第一目标数据、第二目标数据进行...
  • 本申请公开了一种基于角度反射梯度的土壤质地原位分析方法及边缘计算设备,涉及土壤质地识别领域。所述方法包括:针对目标土壤获取多角度变换的视频数据流,同步获取IMU数据流;将视频数据流和IMU数据流进行时空对齐,并生成时序动态流和梯度空间图;时...
  • 本发明涉及智慧安防技术领域,公开了一种基于人工智能的智慧安防方法,包括:利用仅含正常通行视频训练生成对抗网络,构建潜在空间中与通道密度及时间推进相对应的二维流形;计算该流形的截面曲率并形成密度‑时间几何关系的参考模型;在实时监控阶段,通过编...
  • 本发明提供一种基于视频影像的卷烟烟气扩散模式识别方法及装置,它包括采集卷烟烟气扩散全过程的视频影像,从视频影像中抽取烟气扩散图像,并将烟气扩散图像转换为灰度图;按时间顺序逐张计算每张灰度图中烟气区域对应的像素数量占该灰度图总像素数量的比例,...
  • 本发明公开了一种有价值图像场景数据挖掘方法、装置、设备及介质。所述方法包括:确定待挖掘车辆数据以及确定用于描述待挖掘图像场景类别的参考文本描述信息;根据参考文本描述信息与待挖掘车辆数据,从多个图像场景挖掘算法信息中确定目标算法信息,多个图像...
  • 本发明公开了一种基于增强对比学习的视频真伪检测方法、装置及相关设备,包括:获取未标记的真实人脸图像集合,并基于真实人脸图像集合生成方式动态合成伪造负样本;对每一真实人脸图像构建多个视图;通过特征编码器提取真实人脸图像及其多个视图的特征向量;...
  • 本发明公开了一种基于AI视频分析的早期火焰特征识别方法及系统,涉及火焰特征识别技术领域,该方法包括:获取监控摄像设备采集的连续的视频帧序列,获取疑似火焰候选区域集合序列;进行联动火焰区域预测;执行语义不确定性分析,获得语义不确定性系数集合;...
  • 本发明公开了基于数据融合的混凝土搅拌监测与纤维分散性评价方法。本发明中,通过在搅拌全周期内自适应调整视频动态流动值与功率波动方差的贡献权重,显著提升了整个监测方法的场景适应性与评价精准度。该算法创新性地根据搅拌进程动态分配特征权重,在搅拌初...
  • 本发明属于计算机视觉与视频分析技术领域,具体涉及一种基于CLIP辅助的时序自适应滤波弱监督视频异常检测方法。本发明方法设计了融合视觉‑语言跨模态信息的时序建模与滤波框架:首先,通过局部‑全局时序适配器分解并建模视频局部与全局时序依赖,增强模...
  • 本申请公开一种基于大模型协同的音视频多模态解析系统及解析方法,旨在解决现有技术多模态协同分析不足、结构化元数据提取深度不够等问题。本系统包括统一媒体处理智能体、算法处理模块集群、包含多模态内容分析/文本语义分析/知识提炼/结构化输出智能体的...
  • 本发明涉及计算机视觉技术领域,尤其涉及一种课堂行为数据整合与可视化输出系统,包括:数据采集模块,用于获取包含一名或多名教师的课堂实时视频流或历史视频文件;数据处理模块,用于对所述视频流或视频文件进行处理,以提取所述教师身体的至少一个骨骼关键...
  • 本发明提供一种使用2D和3D姿态特征的群组行为识别方法,涉及视频分析技术领域,包括:1.获取具有空间表达能力的3D姿态特征序列;在2D姿态序列基础上,通过三维姿态估计与空间几何约束估计个体的深度、朝向与平面上的3D位置,将局部关节结构映射到...
  • 本申请涉及计算机视觉与数据处理技术领域,公开了篮球比赛运动员点位图的自动生成方法,包括为运动员实例化动态运动学姿态模型;基于所有运动员状态分析并识别其战术角色;根据战术角色自适应选择状态转移函数进行状态预测,得到先验状态;利用当前视频帧的视...
  • 本发明涉及人工智能领域,技术方案可应用在金融科技、医疗健康领域,公开了一种视频场景理解特征提取方法、装置、设备及介质,方法包括:通过模态专用时序变换器分别提取视觉与听觉时序特征;继而利用跨模态动态注意力机制,自适应地计算融合权重并生成初步融...
技术分类