Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于强化学习与视觉语言模型的动态物体定位方法及系统,该动态物体定位方法包括以下步骤:S1:采集多模态传感器数据;S2:通过视觉语言模型提取所述多模态传感器数据中的视觉特征和文本特征;S3:构建强化学习策略网络,将所述视觉特征...
  • 本申请实施例提供了一种图像描述生成方法、装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和数字医疗领域。该方法包括:检测样本图像中目标对象的对象位置、对象类别和对象视觉特征;识别原始图像描述的描述关键词和描述关键词的语义特...
  • 本发明公开了一种遥感图像语义分割优化方法,包括:对遥感图像进行语义分割,得到分类逻辑值图像;提取得到分类逻辑值,将分类逻辑值转换为类别概率,并进行全图置信度量化;将分类逻辑值图像划分为保留区域和待优化区域;构建以图像像素为节点、像素邻接为边...
  • 本发明提供一种基于二阶段语义矫正的图像字幕算法,包括一阶段解码和二阶段解码;所述一阶段解码负责生成出稿字幕,依赖视觉编码器和初稿解码器,结合区域、网格和语义特征,生产对图像内容的初步描述;所述视觉编码器负责将输入图像转化为高维特征向量,采用...
  • 本发明属于航空制造技术领域,具体涉及用于航空结构件机器人制孔的基准孔半监督分割方法,基于机器人制孔的基准孔半监督分割网络的训练,设计基准孔半监督分割网络训练的总损失函数,通过联合基准孔半监督分割网络的训练模型与总损失函数,得到训练后的分割网...
  • 本发明提供了项目备案证明的识别提取方法及系统,所述识别提取方法应用于包括预识别单元、文本拼接单元、文字修正单元和信息提取单元的识别提取系统中,具体为:对项目备案证明文件进行预识别,获取若干个文本对以及文本对的位置信息;基于空间密度聚类,根据...
  • 一种物件识别装置及物件识别方法。物件识别装置包括图像传感器、电动云台机构、至少一个标示以及运算主机。图像传感器感测成像区域以产生图像数据。电动云台机构转动图像传感器来调整成像区域。至少一个标示固设在电动云台机构。运算主机在图像数据对应的画面...
  • 本申请涉及一种基于多模型的产品标签审核方法、系统、装置和介质,其中,该方法包括:获取预设产品的产品标签图片,其中,产品标签图片包含图像标签和文字标签;对文字标签进行文本识别,提取得到预设产品的标签文本信息;基于图像标签,通过多模态模型与第一...
  • 本申请公开了一种多模态商品信息提取方法、系统、设备、介质及产品,涉及图像处理领域,该方法包括:对商品详情页图片进行预处理;采用调试好的文字识别指令模板识别预处理后的商品详情页图片中的文字,得到文本数据;识别文本数据中的脚注及脚注内容,并将脚...
  • 本发明涉及一种骨螺钉图像识别系统及方法,该系统包括TOF摄像机、机器人、检测平台、摄像头、灯源和处理器,该方法包括:通过TOF摄像机扫描并识别钉盒的坐标信息,计算出钉盒内骨螺钉的排列方式、得到行列数据;根据行列数据,处理器相应控制机器人将骨...
  • 本申请涉及电子图纸处理技术领域,具体公开一种针对电子图纸的处理方法、计算机设备及可读存储介质。方法包括:采用多模态处理技术提取出电子图纸中的文本信息和结构化信息;通过深度学习模型识别并定位出所述电子图纸中的若干个目标区域;当识别出目标区域内...
  • 本发明公开了一种字符识别方法、装置、电子设备、存储介质及产品。方法包括:对包含扭曲形变字符的目标图像进行预处理及字符区域检测,得到单字符区域图像;将单字符区域图像输入至形变校正模块,得到字符校正融合特征;形变校正模块用于通过至少两个并行校正...
  • 本申请公开一种发票处理方法、装置及相关设备。该方法包括:获取订单图像、结款图像、候选发票图像;基于订单、结款图像进行图像识别获取图像中的待冲账信息,包括待冲账金额、主体名称、交易日期;基于候选发票图像获取候选发票池;基于待冲账信息以及特定发...
  • 本发明涉及文本提取领域,具体为基于深度学习的文本关键特征提取系统及方法,包括:文本筛选模块、图形构建模块、深度学习模块、集群特征模块和输入融合模块,文本筛选模块用于合并文本集群,图形构建模块用于生成立体图模型,深度学习模块用于通过集群文本扩...
  • 本发明涉及一种基于背景挖掘的开放词汇检测方法、设备及介质,将背景候选集输入CLIP文本编码器,通过对预设的可学习的背景标记编码生成初始背景原型;使用任意分割模型的编码器提取全图像的像素级特征;通过多头交叉注意力模块融合初始背景原型和像素级特...
  • 本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待识别图像;将待识别图像输入至文本识别模型的视觉网络,提取出待识别图像的视觉特征;将视觉特征输入至文本识别模型的语言网络,通过语言网络基于视觉特征提取...
  • 本发明提供一种核电阀门设计文件信息识别采集方法及系统,采集方法包括接收核电阀门设计文件,并基于CNN的阀门设计文件图像识别模型对核电阀门文件进行格式和几何要求预处理,得到目标阀门设计文件;基于CRNN的阀门图纸信息识别模型对目标阀门设计文件...
  • 本申请提供了一种视觉语言模型的测评方法、装置、设备、存储介质及产品,涉及模型测评技术领域,方法包括:获取车辆采集的图像数据,并基于所述图像数据构建测评数据集;所述测评数据集包括所述图像数据对应的标签文本数据;基于所述测评数据集中的标签文本数...
  • 本发明公开了一种基于视觉‑语言模型的满文档案单词识别方法,包括:构建初始特征模块、笔画提取模块、视觉模块、语言模块、模态对齐模块和融合模块;将满文单词图片输入到初始特征提取模块,得到初始图像特征,将特征输入至笔画提取模块、视觉模块中,得到笔...
  • 本发明涉及半导体材料表面特性检测技术领域,公开一种基于机器视觉的半导体表面字符质量检测系统,包括:图像采集单元与处理器,处理器运行前置校验模块,通过计算图像的频谱熵值以校验输入图像的信息保真度;随后,在图像通过校验后,运行稳定性评价模块,该...
技术分类