Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种多模态商品信息提取方法、系统、设备、介质及产品,涉及图像处理领域,该方法包括:对商品详情页图片进行预处理;采用调试好的文字识别指令模板识别预处理后的商品详情页图片中的文字,得到文本数据;识别文本数据中的脚注及脚注内容,并将脚...
  • 本发明涉及一种骨螺钉图像识别系统及方法,该系统包括TOF摄像机、机器人、检测平台、摄像头、灯源和处理器,该方法包括:通过TOF摄像机扫描并识别钉盒的坐标信息,计算出钉盒内骨螺钉的排列方式、得到行列数据;根据行列数据,处理器相应控制机器人将骨...
  • 本申请涉及电子图纸处理技术领域,具体公开一种针对电子图纸的处理方法、计算机设备及可读存储介质。方法包括:采用多模态处理技术提取出电子图纸中的文本信息和结构化信息;通过深度学习模型识别并定位出所述电子图纸中的若干个目标区域;当识别出目标区域内...
  • 本发明公开了一种字符识别方法、装置、电子设备、存储介质及产品。方法包括:对包含扭曲形变字符的目标图像进行预处理及字符区域检测,得到单字符区域图像;将单字符区域图像输入至形变校正模块,得到字符校正融合特征;形变校正模块用于通过至少两个并行校正...
  • 本申请公开一种发票处理方法、装置及相关设备。该方法包括:获取订单图像、结款图像、候选发票图像;基于订单、结款图像进行图像识别获取图像中的待冲账信息,包括待冲账金额、主体名称、交易日期;基于候选发票图像获取候选发票池;基于待冲账信息以及特定发...
  • 本发明涉及文本提取领域,具体为基于深度学习的文本关键特征提取系统及方法,包括:文本筛选模块、图形构建模块、深度学习模块、集群特征模块和输入融合模块,文本筛选模块用于合并文本集群,图形构建模块用于生成立体图模型,深度学习模块用于通过集群文本扩...
  • 本发明涉及一种基于背景挖掘的开放词汇检测方法、设备及介质,将背景候选集输入CLIP文本编码器,通过对预设的可学习的背景标记编码生成初始背景原型;使用任意分割模型的编码器提取全图像的像素级特征;通过多头交叉注意力模块融合初始背景原型和像素级特...
  • 本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待识别图像;将待识别图像输入至文本识别模型的视觉网络,提取出待识别图像的视觉特征;将视觉特征输入至文本识别模型的语言网络,通过语言网络基于视觉特征提取...
  • 本发明提供一种核电阀门设计文件信息识别采集方法及系统,采集方法包括接收核电阀门设计文件,并基于CNN的阀门设计文件图像识别模型对核电阀门文件进行格式和几何要求预处理,得到目标阀门设计文件;基于CRNN的阀门图纸信息识别模型对目标阀门设计文件...
  • 本申请提供了一种视觉语言模型的测评方法、装置、设备、存储介质及产品,涉及模型测评技术领域,方法包括:获取车辆采集的图像数据,并基于所述图像数据构建测评数据集;所述测评数据集包括所述图像数据对应的标签文本数据;基于所述测评数据集中的标签文本数...
  • 本发明公开了一种基于视觉‑语言模型的满文档案单词识别方法,包括:构建初始特征模块、笔画提取模块、视觉模块、语言模块、模态对齐模块和融合模块;将满文单词图片输入到初始特征提取模块,得到初始图像特征,将特征输入至笔画提取模块、视觉模块中,得到笔...
  • 本发明涉及半导体材料表面特性检测技术领域,公开一种基于机器视觉的半导体表面字符质量检测系统,包括:图像采集单元与处理器,处理器运行前置校验模块,通过计算图像的频谱熵值以校验输入图像的信息保真度;随后,在图像通过校验后,运行稳定性评价模块,该...
  • 本发明公开了档案文件智能识别大模型的训练方法、装置、设备及介质,涉及文档识别技术领域。训练方法包括:搭建第一阶段训练的自监督扩散模型:将图像样本进行随机掩码处理生成掩码图像样本,分别输入到图像编码器中提取高维信息,利用tokens选择模块进...
  • 本发明公开了一种用于面向少数民族文献文字识别的方法、装置、工作介质及计算机设备。该方法包括以下步骤:S1、收集并标注少数民族文献文字图像样本,对图像进行预处理,构成数据集;S2、构建注意力机制增强的神经网络模型,神经网络模型包括依次连接的输...
  • 本发明公开了一种用于多模态文档转换的视觉语言模型系统转换方法,该视觉语言模型系统包括有视觉语言模型模块和统一标记格式转换模块,设定一种识别文档页面中的各元素类型以及各元素对应的空间位置和具体内容的标记格式DocTags,视觉语言模型模块通过...
  • 本申请提供基于人工智能的外文票据图像翻译方法、设备和介质,属于数据信息技术领域。该外文票据图像翻译方法包括:获取外文票据图像,将外文票据图像输入至图像识别模型,输出得到票据文字信息和位置坐标信息;将票据文字信息输入至预训练的票据翻译专用模型...
  • 本发明公开了基于图像识别的非格式化磅单智能转换方法及系统,本发明涉及文字智能识别技术领域,解决了对倾斜角度检测精度低,噪声过滤与对比度增强效果受场景限制,导致后续OCR识别准确率不稳定的技术问题,本发明通过针对结构化/无表格磅单分别采用表格...
  • 本发明涉及电力行业技术领域,公开了一种针对电力行业的复杂表格结构识别方法、系统、设备及介质,方法包括:通过第一特征提取操作,本发明捕捉目标待识别表格图像的关键信息,如视觉、文本和布局特征,为后续特征融合和推理提供数据基础。第二特征融合操作整...
  • 本申请实施例提供一种多尺度文本的识别方法、电子设备、存储介质及程序产品。该方法包括:获取携带待识别多尺度文本的图像信息,对图像信息进行优化处理,得到优化图像;确定优化图像中存在待识别文本的图像范围,通过预设的文字识别模型识别对图像范围内的待...
  • 本发明提供一种基于大规模视觉语言模型的表格理解系统和方法,涉及自然语言处理技术领域。首先获取目标表格图像以及对应的问题文本,并进行预处理,获得图像块和文本标记;输入到大规模视觉语言模型中,获得注意力矩阵;基于注意力矩阵估算前述问题文本对图像...
技术分类