Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人类活动识别技术领域,具体公开了一种基于轻量级混合神经网络和自注意力迁移的人类活动识别方法、系统及其介质,包括步骤1,使用HHAR数据集并进行预处理;步骤2,构建基于CNN‑LSTM‑Transformer混合架构的教师模型;步骤...
  • 基于对比语言‑图像预训练模型的鱼类个体识别方法,步骤如下:数据采集与预处理:模型构建:基于预训练的CLIP模型构建鱼类个体识别模型,引入可学习的文本提示模块,将不同鱼类个体的文本描述与图像特征对齐;并设计轻量级的细粒度特征增强模块;模型训练...
  • 本发明公开了一种基于改进VGG16网络及双向特征融合的船舶电缆识别方法。本方法包括图像采集模块、预处理模块、深度学习识别模块和输出模块,该方法首先通过图像预处理模块对施工图进行灰度增强与抗干扰滤波,构建船舶电缆标注数据库;随后采用改进VGG...
  • 本发明涉及核电厂电仪图纸数据自动化提取方法、装置、介质和设备,包括步骤:获取源图纸;识别源图纸的图纸类型;若源图纸的图纸类型为PDF图纸,则按照第一数据提取方法提取PDF图纸的数据并保存为PDF结构化数据;若源图纸的图纸类型为VISIO图纸...
  • 一种钢筋工程图纸的智能识别方法、系统、存储介质及设备,涉及图纸识别技术领域。方法包括:将钢筋工程图纸的电子图像划分为多个识别区域;检测各识别区域中标注线与钢筋构件之间的标注关系,并基于标注关系确定存在歧义场景的目标识别区域;构建目标识别区域...
  • 本发明公开了一种基于深度神经网络模型的论文图片比对方法,通过利用深度卷积神经网络,无需人工逐一审核,深度卷积神经网络可快速处理大量图片数据,实现批量预处理与分析,能在短时间内完成海量论文图片集合的审查,解决人工审核效率低、难应对大数据的问题...
  • 本申请公开了一种任务处理方法及相关装置,涉及数据处理技术领域,方法包括:获取目标任务的任务数据,目标任务为基于图像的文本生成任务,任务数据包括目标图像;对目标图像进行实例分割,得到目标图像中每个实例的边界框;获取目标图像的全局视觉特征,根据...
  • 本发明提供一种基于大规模视觉语言模型的表格理解系统和方法,涉及自然语言处理技术领域。首先获取目标表格图像以及对应的问题文本,并进行预处理,获得图像块和文本标记;输入到大规模视觉语言模型中,获得注意力矩阵;基于注意力矩阵估算前述问题文本对图像...
  • 本申请实施例提供一种多尺度文本的识别方法、电子设备、存储介质及程序产品。该方法包括:获取携带待识别多尺度文本的图像信息,对图像信息进行优化处理,得到优化图像;确定优化图像中存在待识别文本的图像范围,通过预设的文字识别模型识别对图像范围内的待...
  • 本发明涉及电力行业技术领域,公开了一种针对电力行业的复杂表格结构识别方法、系统、设备及介质,方法包括:通过第一特征提取操作,本发明捕捉目标待识别表格图像的关键信息,如视觉、文本和布局特征,为后续特征融合和推理提供数据基础。第二特征融合操作整...
  • 本发明公开了基于图像识别的非格式化磅单智能转换方法及系统,本发明涉及文字智能识别技术领域,解决了对倾斜角度检测精度低,噪声过滤与对比度增强效果受场景限制,导致后续OCR识别准确率不稳定的技术问题,本发明通过针对结构化/无表格磅单分别采用表格...
  • 本申请提供基于人工智能的外文票据图像翻译方法、设备和介质,属于数据信息技术领域。该外文票据图像翻译方法包括:获取外文票据图像,将外文票据图像输入至图像识别模型,输出得到票据文字信息和位置坐标信息;将票据文字信息输入至预训练的票据翻译专用模型...
  • 本发明公开了一种用于多模态文档转换的视觉语言模型系统转换方法,该视觉语言模型系统包括有视觉语言模型模块和统一标记格式转换模块,设定一种识别文档页面中的各元素类型以及各元素对应的空间位置和具体内容的标记格式DocTags,视觉语言模型模块通过...
  • 本发明公开了一种用于面向少数民族文献文字识别的方法、装置、工作介质及计算机设备。该方法包括以下步骤:S1、收集并标注少数民族文献文字图像样本,对图像进行预处理,构成数据集;S2、构建注意力机制增强的神经网络模型,神经网络模型包括依次连接的输...
  • 本发明公开了档案文件智能识别大模型的训练方法、装置、设备及介质,涉及文档识别技术领域。训练方法包括:搭建第一阶段训练的自监督扩散模型:将图像样本进行随机掩码处理生成掩码图像样本,分别输入到图像编码器中提取高维信息,利用tokens选择模块进...
  • 本发明涉及半导体材料表面特性检测技术领域,公开一种基于机器视觉的半导体表面字符质量检测系统,包括:图像采集单元与处理器,处理器运行前置校验模块,通过计算图像的频谱熵值以校验输入图像的信息保真度;随后,在图像通过校验后,运行稳定性评价模块,该...
  • 本发明公开了一种基于视觉‑语言模型的满文档案单词识别方法,包括:构建初始特征模块、笔画提取模块、视觉模块、语言模块、模态对齐模块和融合模块;将满文单词图片输入到初始特征提取模块,得到初始图像特征,将特征输入至笔画提取模块、视觉模块中,得到笔...
  • 本申请提供了一种视觉语言模型的测评方法、装置、设备、存储介质及产品,涉及模型测评技术领域,方法包括:获取车辆采集的图像数据,并基于所述图像数据构建测评数据集;所述测评数据集包括所述图像数据对应的标签文本数据;基于所述测评数据集中的标签文本数...
  • 本发明提供一种核电阀门设计文件信息识别采集方法及系统,采集方法包括接收核电阀门设计文件,并基于CNN的阀门设计文件图像识别模型对核电阀门文件进行格式和几何要求预处理,得到目标阀门设计文件;基于CRNN的阀门图纸信息识别模型对目标阀门设计文件...
  • 本申请涉及一种文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待识别图像;将待识别图像输入至文本识别模型的视觉网络,提取出待识别图像的视觉特征;将视觉特征输入至文本识别模型的语言网络,通过语言网络基于视觉特征提取...
技术分类