Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种非结构化户外环境的图像处理方法及装置、介质,图像处理方法包括:将待处理的目标图像输入至预设的多任务神经网络模型;多任务神经网络模型对待处理的目标图像进行特征提取,并对不同尺度的特征进行融合,得到多尺度特征融合结果;分割头对多尺度特征融合...
  • 本发明公开了一种双路径WNet的风力发电机叶片裂缝轻量化分割方法,包括如下步骤:S1.数据准备与预处理:获取风力发电机的叶片巡检图像,并对所有叶片巡检图像进行预处理;将预处理后的叶片巡检图像划分为训练集、验证集和测试集;S2.网络模型构建:...
  • 本发明公开基于边界感知的门控多级多模态语义分割方法及系统,涉及语义分割技术领域,将可见光图像和数字表面模型数据输入多模态语义分割网络进行语义分割,可见光编码器接收可见光卷积特征和数字表面模型卷积特征,先进行自注意力建模,再进行交叉注意力建模...
  • 本发明提供了一种民航模拟副驾驶舱元器件视觉伺服定位方法,该方法包括以下步骤:将搭配深度摄像头的机器人安装于副驾驶,并用头部摄像头采集全局图像;通过图像处理获取到清晰的驾驶舱布局图;将驾驶舱布局划分为:顶部区域、主仪表板、遮光板、中央操纵台、...
  • 本申请公开了一种面向短路、断路与开路缺陷的语义融合检测方法及装置,该方法包括:从待检测图像中提取候选区域,对候选区域进行多尺度裁剪,生成多个不同尺度的输入图像,并对输入图像进行语义编码生成语义向量;获取包含短路、开路、断路缺陷形态描述的提示...
  • 本申请公开了一种铭牌识别方法及装置,属于图像处理技术领域。方法包括:获取待识别铭牌的铭牌图像;对所述铭牌图像进行特征提取,根据提取的铭牌特征匹配出所述待识别铭牌的目标铭牌模板;根据所述目标铭牌模板的内容布局,对所述铭牌图像的内容区域进行检测...
  • 本发明涉及一种基于视觉语言大模型的表计识别方法及系统,旨在解决工业表计识别中环境适应性差、专业泛化能力弱及缺乏可靠性保障的技术问题。核心在于构建了一套Prompt体系,通过任务分解、特征引导及格式约束,将通用视觉语言大模型专业化。方法包括:...
  • 本发明公开了一种书页弯曲提示方法、装置、存储介质及计算机设备,涉及图像处理技术领域,主要在于能够提高书页弯曲提示的处理效率和处理准确度。其中方法包括:获取原始书页图像;对所述原始书页图像中的原始行文本进行拉直校正,将拉直校正后的所述原始行文...
  • 本发明涉及信息处理系统以及程序产品。提供一种抑制用户的作业量的信息处理系统以及信息处理系统的控制程序。实施方式所涉及的信息处理系统具备接收部、OCR执行部、管理部、提取部、校正候补输出部以及校正受理部。接收部接收图像信息。OCR执行部通过O...
  • 提供一种信息处理系统及程序产品,用于抑制用户的作业量。实施方式涉及的信息处理系统具备接收部、OCR执行部、管理部、提取部、订正候补输出部、准确度信息输出部以及订正受理部。接收部接收图像信息。OCR执行部通过OCR对图像信息进行字符识别。管理...
  • 本发明公开了藏汉英多模态预训练模型的跨语言对齐方法,涉及跨语言对齐技术领域,所述跨语言对齐方法为通过数据采集并生成正例样本和负例样本,使用视觉编码器处理图像数据,提取图像补丁特征并融合位置嵌入,文字编码器处理藏汉英文本,生成词嵌入序列,进行...
  • 本发明公开了一种结合OCR与多层级校验的电费通知单处理方法,涉及计算机视觉与智能数据处理技术领域,所述方法包括:对电费通知单图像进行OCR处理,获取全文本及位置信息;基于预定义语义标签与位置信息定位并提取关键字段的初始文本值,组合为结构化数...
  • 本发明公开了基于近端策略优化的画作大模型微调系统及方法,涉及人工智能技术领域,该方法包括:集图像和图像文本构建训练集;提取图像全局与局部特征得到图像特征向量,提取文本特征向量并进行跨模态对齐;检索外部知识库并通过门控机制融合知识,计算注意力...
  • 本申请涉及模式识别技术领域,公开了一种数据审核方法,该方法包括:获取司机提交的资格数据,资格数据包括多个证件数据,证件数据包括证件图像和证件信息;将证件图像进行预处理,得到目标图像;根据证件图像的类型,通过OCR识别目标图像的文本,得到第一...
  • 本申请提供了一种作业批改系统的评测方法、装置和设备,包括:获取目标测试集,目标测试集包括多个作业维度下的样本作业图像;对目标测试集中的样本作业图像进行数据标注,得到标注结果;根据被测作业批改系统针对目标测试集的输出结果和标注结果,对被测作业...
  • 本发明提供一种文字识别方法、装置、电子设备及存储介质,涉及计算机视觉技术领域,该方法在解码过程中,联合采用了并行解码、自回归解码以及双向解码,可以充分应用各种解码方式的优势,在并行解码之后进行自回归解码,不仅可以对并行解码结果进行修正,提高...
  • 本发明涉及人工智能技术领域,且公开了基于人工智能的书法学习智能评估与个性化指导系统及方法,包括用户输入模块、图像处理模块、人工智能评估模块、反馈与指导模块、学习进度跟踪模块、云端数据存储与分析模块、虚拟书法老师模块。本发明中,通过实时分析学...
  • 本发明公开了一种基于大模型驱动的OCR识别结果修正方法及系统,属于文本修正技术领域,该修正方法具体步骤如下:Ⅰ:获取初步OCR文本后,基于多维度特征对OCR文本进行不确定性评估,并判断是否需要触发修正流程;Ⅱ:触发修正流程后,通过小型语言模...
  • 本发明公开了一种基于旋转位置编码的手写数学公式识别方法,涉及手写数学公式识别技术领域。其特征在于:针对现有方法在长公式序列建模中存在的长程依赖捕捉不足问题,构建端到端的编码器‑解码器框架,在Transformer解码器的自注意力层中引入旋转...
  • 本发明的技术方案是公开了一种基于OCR识别与语义分析的多模态数据智能提取系统,采用“四层架构设计”,分别为数据层、处理层、服务层和应用层。本发明公开的系统通过多模态数据预处理提升OCR识别的稳定性与输入质量,在识别流程中引入语义理解机制以增...
技术分类