Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于工地场景上下文信息引导的安全帽佩戴检测识别方法、系统及介质,属于视觉识别的技术领域,首先,利用主干网络部分提取图片样本的特征信息。利用动态上下文信息注意力引导细化特征信息,增强模型对安全帽目标的聚焦能力;基于多阶段的动态...
  • 本发明属于图像识别和风险分析技术领域,具体涉及一种输变电工程的环境干扰警示方法、系统、设备及介质,方法先基于输变电工程的通道检测数据识别通道异常信息;再将输变电工程的通道图像数据转化为各图像类型的优化通道图像数据,并基于此数据识别通道异物信...
  • 本发明提供了基于大模型的监控视频用户关注信息的生成方法和系统,包括:将校验后的文本描述与对应的视频路径,以及提示词进行融合,构建训练集;利用训练集,采用全参数微调方式,对多模态视觉语言模型进行指令微调,得到微调后的多模态视觉语言模型;将微调...
  • 本发明涉及生理信号监测与计算机视觉交叉技术领域,特别是一种基于掩码自编码器的热红外视频呼吸监测方法及设备。本发明通过少量RGB–热红外的人脸关键点构建仿射变换矩阵,将RGB视频的关键点跟踪结果映射到热红外视频上,从而实现无需大规模热红外视频...
  • 本发明涉及计算机视觉领域,具体涉及一种无监督的课堂头部姿态专注度分析方法、装置及设备。包括:采集课堂场景下监控视频数据中的学生视频片段;提取反映学生头部姿态变化的姿态参数,并基于连续时间片段构建对应的头部姿态时序数据;对头部姿态时序数据进行...
  • 本发明涉及计算机视觉技术领域,具体公开了一种心脏超声心动图视频左心室分割方法及系统,其设计了一种左心室视频分割网络,该网络包括主干、CNN分支和记忆与精炼模块,主干包括下采样层、Transformer编码块、提示编码器、掩膜解码器;CNN分...
  • 本发明公开了基于动作单元先验及微表情增强的表情定位方法及系统,涉及计算机视觉与情感计算技术领域,采用MDMO光流特征捕捉面部主运动方向,结合主干网络建模时空关联,提升了特征提取的有效性;引入AU先验知识构建目标AU集合,通过AU引导的对齐机...
  • 本申请公开了一种视频处理方法、装置及电子设备。其中,该方法包括:获取原始视频对应的视频帧序列;通过视频检测算法中的双分支网络分别确定视频帧序列的第一特征和第二特征,其中,双分支网络中的第一分支通过提取视频帧序列中的高频噪声分量,并确定高频噪...
  • 本申请实施例公开了一种视频的处理方法、装置、计算机设备、介质和程序产品,获取针对待识别视频的查询文本,和从待识别视频中抽取得到的m个视频帧,m为大于数量阈值的整数,减少了对关键的视频帧的遗漏概率,甚至还能够进一步降低m个视频帧中冗余视频帧的...
  • 本发明涉及视频数据处理技术领域,尤其涉及一种视频数据处理方法、装置及电子设备,所述方法包括:由用户交互输入视频数据,并对视频数据进行预处理,对视频数据的分帧图像进行连续性分析,并以连续性分析结果对视频数据的分帧图像进行场景分类,以得到各视频...
  • 本发明涉及人工智能与多媒体处理技术领域,具体涉及一种基于创意雷达的视频理解方法及系统,该方法包括获取用户输入的视频片段,并利用多模态编码器提取多模态特征张量;基于预定义的创意维度集合,利用多模态特征张量计算各创意维度的覆盖率,当特定维度的覆...
  • 本发明涉及一种视频动作关键帧检测方法及系统,属于机器视觉技术领域,包括获取视频、对其处理得到对应的人物实例分割掩码序列以及关节点坐标;对所述关节点坐标进行修正和预处理;计算全局运动、掩码面积变化率、掩码纵横比变化率三大特征;对三大特征进行加...
  • 本发明公开了计算机视觉技术领域内的一种基于双池化和HBLU的火焰检测方法。该检测方法包括:S1:对预先获取的火焰视频流数据集G1进行关键帧处理,并进行图像增强,得到关键帧增强数据集G3;S2:采用激活函数HBLU、星型多尺度特征提取模块PK...
  • 本发明公开了一种基于深度学习与轨迹分析的养殖鱼类异常行为检测方法及系统,涉及计算机视觉技术领域。所述方法是先获取养殖池实时视频流并进行预处理,然后利用目标检测模型识别视频帧中所有鱼类个体及其种类标签,以及针对每个个体,将其边界框输入实例分割...
  • 本发明实施例公开了一种视频检测方法和装置。本发明实施例的方法首先获取待检测视频,计算该视频中各相邻帧间的光流场,随后提取与预设风险类别相关的运动分量(如垂直或水平位移),生成每帧的风险初检结果,继而对所有初检结果进行统计形成结构化的风险统计...
  • 本发明公开了一种多功能智能录音笔及其工作方法、云端框架,本发明通过多模态场景识别融合音频、视觉、传感器及指令数据,动态判定实际应用场景,通过动态上下文的内容精筛评估内容连贯性与必要性,随后并行执行高价值音频段与视频段的独立智能标记,精准识别...
  • 本申请公开了一种基于人工智能模型的视频处理方法及相关装置,涉及图像处理领域,其中的基于人工智能模型的视频处理方法包括:获得视频数据中多帧图像对应的视觉特征向量和提示词对应的文本特征向量;获得每帧所述图像对应的视觉特征向量与所述文本特征向量之...
  • 本申请公开了一种人形数据处理方法、装置、电子设备及计算机程序产品。该方法包括:对至少两个通道的视频流进行人形轨迹识别,得到至少一条人形轨迹,不同通道对应的视频采集设备的拍摄范围存在重叠;基于各条人形轨迹中的人形关键点及预设的感兴趣区域,确定...
  • 本发明涉及深度学习语义分割技术领域,具体涉及一种基于文本引导混合专家机制的多模态视频序列分割方法;方法包括:将所述多模态融合特征矩阵输入至预训练大模型的解码器,预测生成分割掩码,并进行可视化处理,输出语义分割图;将预测生成的分割掩码和文本特...
  • 本发明公开了一种基于多目标跟踪的消防通道占用检测方法。该方法首先通过背景减除和形态学处理提取前景目标,然后采用基于交并比IOU匹配的多目标跟踪算法,为每个目标建立独立的生命周期管理机制。通过计算目标的持续存在时间,并结合目标位置与预设禁停区...
技术分类