Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种面向鸟群监测的视觉文本弱监督集群计数方法及装置,包括:步骤1,设计有序数字序列嵌入文本提示模板,利用冻结文本编码器生成文本特征及分类器权重;输入鸟群图像至原始图像编码器获取多尺度视觉特征;步骤2,通过可学习特征适配器将视觉特...
  • 本发明提供一种基于深度学习的工程图纸钢筋大样注释文本检测方法、系统、设备及存储介质,方法包括如下步骤:S1、工程图纸图像预处理及钢筋大样注释文本区域数据集标注;S2、构建分阶段多尺度特征图提取骨干网络构架;S3、在各尺度特征图中引入压缩激励...
  • 本发明涉及OCR识别与自然语言处理技术领域,且公开了一种基于大模型的OCR文档智能要素提取系统,包括OCR识别与大模型要素提取系统、基于本地正反向知识库二次优化系统、内容提取标准化与智能纠错的后处理系统、专家确认系统以及知识库系统,所述OC...
  • 本申请公开了一种作业批改方法、系统、装置、电子设备及存储介质,涉及智能教育技术领域,包括:将预处理后的作业图像输入整页批改模块、单题批改模块和口算批改模块并行进行整页批改、单题批改以及口算批改,整页与口算批改结束时,合并整页批改结果、口算批...
  • 本公开提供了一种基于多模态大模型的表格处理方法及装置、电子设备,涉及人工智能领域。该方法包括:采用预先训练好的视觉编码器对表格图像进行处理,得到表格图像的视觉数据单元,其中,视觉编码器是采用自监督对比学习方法训练得到的;将视觉数据单元以及文...
  • 本发明涉及文件自动化处理技术领域,尤其涉及基于人工智能模型和RAG的文件识别处理系统,包括以下模块:文件图像预处理模块,用于接收传真件、扫描件或电子文档,并通过去噪、角度校正及二值化处理,将输入文档转换为标准化图像;文件分类模块,基于卷积神...
  • 本发明公开了Web界面元素识别方法、系统、设备及介质,属于人工智能及Web界面开发技术领域,本发明要解决的技术问题为如何提高对动态元素、CSS隐藏元素的识别率,从而使Web界面元素定位更为精确,采用的技术方案为:视觉定位:输入页面url地址...
  • 本发明提供一种用于点阵笔的笔迹数智化检测系统及电子设备,涉及计算机技术领域,包括:基于规则数据中的书写规范要求识别笔画轨迹规范性,并基于解题步骤完整性标准验证书写逻辑完整性,生成包含时空位置、缺陷类型及严重等级的分析结果;根据分析结果,若存...
  • 本发明公开了一种图像文本提取方法、装置、设备、介质及程序产品,本发明涉及图像识别技术领域。该方法包括:基于像素分类阈值,将待识别图像中的像素点分为背景像素点和文字像素点;对待识别图像中的像素点进行逐行扫描,根据每行像素点中背景像素点的数量,...
  • 本申请提供了一种数据样本集生成方法及模型训练方法,数据样本集生成方法包括响应于数据集生成请求,获取预设的第一图像和第二图像;按照预设的标签生成规则生成所述第一图像的第一数据标签和第二数据标签后生成所述第一图像的目标数据标签,基于所述第一图像...
  • 本公开提供了一种多模态文档理解方法及装置、电子设备,涉及文档理解技术领域。该方法包括:从文档图像中提取初始特征图,并对初始特征图进行下采样,得到视觉数据单元;从初始特征图中提取文本区域的特征,基于Q‑Former结构模型对文本区域的特征和文...
  • 本发明提出了一种卡牌图像特征识别方法及系统,涉及卡牌图像特征识别技术领域,方法包括获取待检测卡牌的宏观图像数据和光学响应图像数据;根据宏观图像数据提取目标几何特征的边界,并基于目标几何特征的边界生成限定区域;根据限定区域和光学响应图像数据对...
  • 本发明公开了一种基于异质特征联合学习的数显仪表识读处理方法及系统,属于图像识别技术领域。其中,关键点检测模型能够精准定位仪表数值区域并深层次提取原始拍摄图像的有效特征信息,从而得到精准的关键点检测结果,基于关键点检测结果能够准确裁剪出待识别...
  • 本发明公开一种化学结构智能提取方法及系统、计算机可读存储介质,本方法包括文档预处理、深度学习目标检测、光学字符识别、跨模态语义映射与化学结构图解析等技术流程,其核心创新在于融合光学化学结构图识别与多模态大语言模型,自动识别并理解化学结构图、...
  • 本申请公开了一种图像识别方法及装置,属于电子技术领域。该方法包括:对第一图像识别,得到第一图像中每行字符的坐标信息;基于坐标信息和第一图像中的字符平均行高,将第一图像中的字符划分为至少一个段落;基于至少一个段落,播放第一图像中的文字。
  • 本发明涉及基于图网络拓扑修正的老挝语文本图像文本识别方法及装置,属于自然语言处理领域。老挝语文本中广泛存在的上下标符号,为了解决老挝语文本图像中字符上下标丢失的问题,提出了一种基于图网络拓扑修正的老挝语文本图像识别方法,主要由老挝语文本图像...
  • 本发明涉及一种用于英语阅读理解的智能辅助工具及方法,属于英语阅读理解辅助工具技术领域。该一种用于英语阅读理解的智能辅助工具及方法,包括壳体、光学识别模块、显示与交互模块、核心处理模块和供能模块,所述显示与交互模块安装于壳体的侧端,所述供能模...
  • 本发明涉及的一种基于深度学习的指针仪表读数方法,以解决现有技术中指针仪表读数方法获取的仪表读数精度不足的技术问题。本发明提供的一种基于深度学习的指针仪表读数方法,通过从表盘图像中获取必要的关键特征数据,对关键特征数据中的刻度点数据进行排序后...
  • 本发明是一种OCR文字审核的方法,将OCR识别结果中属于同一行且位置相近的文本框内容合并为一个,然后再进行文本审核,可有效减少现有技术存在的漏审情况。本发明的优点:方法设计合理,将OCR识别结果中属于同一行的并且位置相近的文本框进行合并再进...
  • 本发明涉及机器人技术领域,尤其涉及一种带电作业机器人末端工具锁紧判断方法。获取作业过程中的图像信息和视频信息,将图像信息进行处理和多边形标注,构建训练数据集,逐帧提取视频信息中的作业图像并进行处理,通过训练数据集对处理完成的作业图像进行识别...
技术分类