Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了基于深度学习的视频内容语义理解与文本描述生成方法, 涉及多媒体信息处理技术领域, 本发明通过CLIP模型计算文本与视频帧的语义相似度, 选取相关关键帧并聚合特征;分别提取音频、视觉和语义特征;利用自注意力对齐不同模态特征, LS...
  • 本公开提供了视频生成模型的训练方法、视频生成方法和装置, 涉及人工智能技术领域, 尤其涉及计算机视觉、深度学习、大模型等技术领域, 可应用于基于人工智能的内容生成等场景。具体实现方案为:对预训练的第一模型进行结构改造, 以得到第二模型, 并...
  • 本发明涉及安全检测技术领域, 具体涉及一种复杂环境下个体特征及行为识别方法, 通过视频流信息处理技术获得多路摄像头实时视频数据流并进行处理;读取预先的摄像头图像划分区域标注位点的文本, 获得每个摄像头的划分区域图像;利用轻量化检测模型检测划...
  • 本发明公开了一种视频事实与观点的对齐溯源方法, 涉及信息检索与验证技术领域, 包括, 使用计算机视觉技术对视频进行帧分析, 提取视频中的场景、对象、动态特征和背景信息, 利用语音识别技术从视频中提取音频, 将音频转化为文本信息, 利用事件抽...
  • 本公开提供了场景生成方法、装置、设备以及存储介质, 涉及人工智能领域, 尤其涉及计算机视觉、深度学习、大模型等技术领域, 可应用于基于人工智能的内容生成场景。具体实现方案为:将目标场景的二维图转换得到该目标场景的三维点云;基于该目标场景的三...
  • 本公开提供了一种球类运动分析方法、装置、电子设备及存储介质, 涉及人工智能技术领域, 尤其涉及计算机视觉、深度神经网络和运动分析技术领域。具体实现方案为:响应于进入发球环节, 基于采集得到的球类运动视频, 拟合得到球体的运动轨迹;基于运动轨...
  • 本发明涉及图片识别方法技术领域, 具体涉及一种异常图片自动识别方法, 包括:从面向对象存储中批量读取监控视频文件, 对视频文件进行分布式抽帧;对抽帧后的图片进行分层抽样, 组成全是正样本的训练集训练PatchCore模型;确定异常得分阈值,...
  • 本申请公开了一种视频融合处理方法、系统、电子设备及存储介质, 涉及视频处理技术领域, 旨在解决对石油石化场站进行监控的效率较低、准确度较差的问题。包括:获取石油石化场站内通过多个视频监控设备采集到的多个视频图像;基于改进的计算机视觉特征提取...
  • 本发明涉及人工智能领域, 可应用于金融科技、医疗健康等业务系统平台中, 公开了基于动态多模态的视频理解方法、装置、设备及介质, 包括:获取待理解的视频数据;对视频数据进行视觉编码处理, 得到相应的视觉特征;对视频数据进行非视觉的多模态编码处...
  • 本发明公开了一种基于深度学习的结晶器保护渣覆盖状态识别的方法, 包括以下步骤:S1、通过实验手段获取保护渣异常覆盖的图像数据, 并对图像进行预处理和标注, 构建训练数据集;S2、构建保护渣覆盖状态识别模型;S3、基于所述训练数据集对所述模型...
  • 本发明涉及计算机视觉技术领域, 可运用于医疗领域和金融科技领域, 公开了基于动态强化学习的关键帧提取方法、装置、设备及介质, 应用于电子应用于高频交易异常行为监控场景中, 或可应用于医疗手术关键帧提取场景中, 其中方法包括:获取原始视频流并...
  • 本发明涉及人工智能技术领域, 可运用于医疗领域和金融科技领域, 公开了多模态视频特征提取方法、装置、设备及存储介质, 应用于金融单据自动化处理场景中, 或可应用于医学影像辅助诊断场景中, 其中方法包括:获取初始多模态数据, 对其进行预处理,...
  • 本发明提供一种基于视觉语言模型的自动化动作轨迹标注系统及方法, 涉及视觉技术模型领域。该基于视觉语言模型的自动化动作轨迹标注系统, 包括关键帧提取模块、VLM语义标注模块、历史标注数据库、扩散模型优化模块和反思修正模块, 所述关键帧提取模块...
  • 本发明涉及人工智能技术领域, 应用于智慧医疗和金融领域, 公开了一种视频理解文本生成方法、装置、计算机设备及存储介质, 包括:根据预设时间间隔于输入视频中提取关键帧, 获得对应的关键帧单帧图像;提取关键帧单帧图像的时空特征;动态计算各时间步...
  • 本发明公开了一种基于动态卷积核的内容伪造检测方法、装置、设备及介质。所述方法包括:提取待检测视频的视频帧, 获取帧序列;将所述帧序列通过预设提取网络进行特征提取, 获取每个视频帧对应的域特征向量;通过预设动态核生成网络根据所述域特征向量生成...
  • 本发明公开了一种基于多尺度图像检索的隧道病害定位处理方法、系统及平台;本发明通过方法基于多尺度图像检索处理, 分别生成并获取与待隧道病害定位处理相对应的第一数据和第二数据;并基于第一数据和第二数据生成相对应的第三数据;其中, 第一数据为当前...
  • 本申请提出的视频时刻检索方法和装置、电子设备、存储介质, 涉及人工智能技术领域, 适用于金融科技领域及医疗健康领域。该方法包括:对目标视频进行时空编码, 得到初始时空特征图;通过第一分层自适应粒度变换器对初始时空特征图进行特征变换, 得到第...
  • 本申请涉及计算机视觉和自然语言处理技术领域, 具体公开了一种基于跨模态对比学习的视频内容识别方法及装置。本申请通过对比学习策略对视频时空特征和音频频谱特征进行对齐, 使得特征对齐准确率提升, 并且利用动态融合解码器对视频特征和音频特征进行动...
  • 本申请涉及数据处理技术领域, 公开了一种基于动态稀疏的视频理解方法、装置、设备及介质, 该方案通过时空特征编码器对视频帧序列进行时空特征提取和转换, 能够充分保留视频的时空信息, 输出具有丰富语义的视频特征。利用动态稀疏注意力机制对视频语义...
  • 本发明属于视频处理技术领域, 具体涉及一种基于多模态视觉大模型的视频态势标签构建方法, 包括以下步骤:S1:获取待识别视频, 并对所述待识别视频进行预处理;S2:将所述视觉特征、文本描述特征及音频特征分别进行特征转换得到可识别视觉文本序列、...
技术分类