Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了场景生成方法、装置、设备以及存储介质, 涉及人工智能领域, 尤其涉及计算机视觉、深度学习、大模型等技术领域, 可应用于基于人工智能的内容生成场景。具体实现方案为:将目标场景的二维图转换得到该目标场景的三维点云;基于该目标场景的三...
  • 本公开提供了一种球类运动分析方法、装置、电子设备及存储介质, 涉及人工智能技术领域, 尤其涉及计算机视觉、深度神经网络和运动分析技术领域。具体实现方案为:响应于进入发球环节, 基于采集得到的球类运动视频, 拟合得到球体的运动轨迹;基于运动轨...
  • 本发明涉及图片识别方法技术领域, 具体涉及一种异常图片自动识别方法, 包括:从面向对象存储中批量读取监控视频文件, 对视频文件进行分布式抽帧;对抽帧后的图片进行分层抽样, 组成全是正样本的训练集训练PatchCore模型;确定异常得分阈值,...
  • 本申请公开了一种视频融合处理方法、系统、电子设备及存储介质, 涉及视频处理技术领域, 旨在解决对石油石化场站进行监控的效率较低、准确度较差的问题。包括:获取石油石化场站内通过多个视频监控设备采集到的多个视频图像;基于改进的计算机视觉特征提取...
  • 本发明涉及人工智能领域, 可应用于金融科技、医疗健康等业务系统平台中, 公开了基于动态多模态的视频理解方法、装置、设备及介质, 包括:获取待理解的视频数据;对视频数据进行视觉编码处理, 得到相应的视觉特征;对视频数据进行非视觉的多模态编码处...
  • 本发明公开了一种基于深度学习的结晶器保护渣覆盖状态识别的方法, 包括以下步骤:S1、通过实验手段获取保护渣异常覆盖的图像数据, 并对图像进行预处理和标注, 构建训练数据集;S2、构建保护渣覆盖状态识别模型;S3、基于所述训练数据集对所述模型...
  • 本发明涉及计算机视觉技术领域, 可运用于医疗领域和金融科技领域, 公开了基于动态强化学习的关键帧提取方法、装置、设备及介质, 应用于电子应用于高频交易异常行为监控场景中, 或可应用于医疗手术关键帧提取场景中, 其中方法包括:获取原始视频流并...
  • 本发明涉及人工智能技术领域, 可运用于医疗领域和金融科技领域, 公开了多模态视频特征提取方法、装置、设备及存储介质, 应用于金融单据自动化处理场景中, 或可应用于医学影像辅助诊断场景中, 其中方法包括:获取初始多模态数据, 对其进行预处理,...
  • 本发明提供一种基于视觉语言模型的自动化动作轨迹标注系统及方法, 涉及视觉技术模型领域。该基于视觉语言模型的自动化动作轨迹标注系统, 包括关键帧提取模块、VLM语义标注模块、历史标注数据库、扩散模型优化模块和反思修正模块, 所述关键帧提取模块...
  • 本发明涉及人工智能技术领域, 应用于智慧医疗和金融领域, 公开了一种视频理解文本生成方法、装置、计算机设备及存储介质, 包括:根据预设时间间隔于输入视频中提取关键帧, 获得对应的关键帧单帧图像;提取关键帧单帧图像的时空特征;动态计算各时间步...
  • 本发明公开了一种基于动态卷积核的内容伪造检测方法、装置、设备及介质。所述方法包括:提取待检测视频的视频帧, 获取帧序列;将所述帧序列通过预设提取网络进行特征提取, 获取每个视频帧对应的域特征向量;通过预设动态核生成网络根据所述域特征向量生成...
  • 本发明公开了一种基于多尺度图像检索的隧道病害定位处理方法、系统及平台;本发明通过方法基于多尺度图像检索处理, 分别生成并获取与待隧道病害定位处理相对应的第一数据和第二数据;并基于第一数据和第二数据生成相对应的第三数据;其中, 第一数据为当前...
  • 本申请提出的视频时刻检索方法和装置、电子设备、存储介质, 涉及人工智能技术领域, 适用于金融科技领域及医疗健康领域。该方法包括:对目标视频进行时空编码, 得到初始时空特征图;通过第一分层自适应粒度变换器对初始时空特征图进行特征变换, 得到第...
  • 本申请涉及计算机视觉和自然语言处理技术领域, 具体公开了一种基于跨模态对比学习的视频内容识别方法及装置。本申请通过对比学习策略对视频时空特征和音频频谱特征进行对齐, 使得特征对齐准确率提升, 并且利用动态融合解码器对视频特征和音频特征进行动...
  • 本申请涉及数据处理技术领域, 公开了一种基于动态稀疏的视频理解方法、装置、设备及介质, 该方案通过时空特征编码器对视频帧序列进行时空特征提取和转换, 能够充分保留视频的时空信息, 输出具有丰富语义的视频特征。利用动态稀疏注意力机制对视频语义...
  • 本发明属于视频处理技术领域, 具体涉及一种基于多模态视觉大模型的视频态势标签构建方法, 包括以下步骤:S1:获取待识别视频, 并对所述待识别视频进行预处理;S2:将所述视觉特征、文本描述特征及音频特征分别进行特征转换得到可识别视觉文本序列、...
  • 本发明涉及多通道视频中问题帧行为聚类分析方法及系统, 包括步骤:从多路视频中分别提取问题帧片段, 获取对应的时序特征;通过时序深度神经网络对时序特征进行行为特征编码, 输出统一长度的高维特征向量, 进行归一化、对齐处理, 并映射到多通道共享...
  • 本发明公开一种基于深度学习的智慧工地安全风险识别方法与系统, 包括:S1:采集视频流数据并进行预处理, 得到标准化图像帧;S2:根据标准化图像帧, 计算增强特征图, 再根据增强特征图, 构建关键点关联矩阵, 计算姿态特征向量;S3:根据姿态...
  • 本发明公开了一种应对多遮挡环境的渔船金枪鱼渔获物自动计数方法, 属于智慧渔业技术领域。该方法包括数据获取、数据预处理、构建基于YOLO网络的检测模型、设定计数区域、编写计数逻辑、改进目标追踪算法以及系统集成等步骤。通过构建专门的目标检测模型...
  • 本发明涉及图像处理技术领域, 具体涉及一种带压修井作业现场用智能监控预警方法, 包括:获取带压修井作业现场的实时监控视频;在实时监控视频中提取动态变化帧;对每个动态变化帧的像素点进行聚类处理, 获取多个聚类簇;确定各聚类簇的气体纯净性指标;...
技术分类