Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种建筑施工图关键信息智能提取方法及系统,该系统包括文本识别与纠错模块、CAD结构解析模块、多模态信息融合与理解模块及冲突消解与结构化输出模块。该方法通过融合OCR技术与大语言模型纠错机制提升文本识别鲁棒性,结合CAD矢量解析构...
  • 本发明涉及文档图像分析与光学字符识别技术领域,且公开了一种基于多模态自适应OCR的档案录入快捷识别方法,包括以下步骤:步骤S1:接收非结构化档案的图像文件;步骤S2:采用改进的多模态版面分析模型,对所述图像文件进行版面分析,所述改进的多模态...
  • 本公开实施例提供了一种媒体数据的标注方法、装置、设备、介质及程序产品。所述方法包括识别待标注媒体数据的文本内容得到文本识别结果,其中,所述文本识别结果包括第一识别文本和置信度;根据所述待标注媒体数据的图像内容和文本内容确定第二识别文本;将所...
  • 本申请提供一种文本识别方法、装置、设备及存储介质,用于解决文本识别灵活性较低的问题。该方法至少包括:获取待识别图像包含的多个字符所在的文本区域;对文本区域进行字符特征提取,获得字符特征序列;其中,字符特征序列包含:多个字符各自的字符特征;分...
  • 本发明公开试卷方向校正方法、电子设备和存储介质,其中,一种试卷方向校正方法,包括:获取试卷图片预设行数的位置信息,基于所述预设行数的位置信息判断所述试卷图片的角度是否达到预设角度,其中,所述预设角度包括0度和180度;若没有达到所述预设角度...
  • 本发明提供了一种扭曲文字识别方法及系统,涉及文字识别的技术领域。扭曲文字识别方法包括以下步骤:构建具有字符切割网络、扭曲校正网络和字符识别网络的文字识别模型,并对字符切割网络进行预训练;获取图像信息,基于图像信息对预训练后的文字识别模型的参...
  • 本申请提供一种听写方法、装置及相关设备,听写方法,应用于电子设备,包括:响应于听写触发操作,播放当前听写信息,当前听写信息为目标听写信息集合中多个听写信息中的一个;获取当前书写信息;基于当前听写信息判断当前书写信息是否正确,并记录当前听写信...
  • 本发明涉及智能图书馆管理技术领域,具体公开了一种基于视觉识别的图书智能盘点方法,方法包括语义地图构建、动态任务规划、图书状态解析、数据智能融合和空间优化推演。本方案设计分层递进、实时响应的动态任务规划框架,将高层任务指令分解为可执行的机器人...
  • 本申请公开了一种函数图像的数据提取方法、装置、设备及介质,该方法包括:提取待提取的函数图像中的图像语义信息和轴元素像素坐标;轴元素像素坐标包括线像素坐标和刻度值像素坐标,线像素坐标包括轴线像素坐标和刻度线像素坐标;基于颜色特征,提取函数图像...
  • 本发明公开了一种兼容电子化与纸质化试题采集方法及系统,该方法包括:当需要进行电子化试题采集时,在移动终端上进入对应的试题采集页面,触发系统导入采集后加载移动终端上线上做题平台对线上做题平台上对应的错题进行导入采集;当需要进行纸质化试题采集时...
  • 本发明提出了一种基于无线通信的远程计量仪表读数方法,包括以下步骤:步骤一、接收来自远程终端设备发送的唤醒指令,将处于低功耗睡眠模式的数据采集终端唤醒至工作模式;步骤二、控制数据采集终端中的图像采集模块对计量仪表的显示区域进行图像采集,获取计...
  • 本发明涉及深度学习技术领域,尤其涉及一种基于DeepLabV3+的鸡心果果实分割系统及方法,采用MobileNetV2网络对输入的鸡心果图像进行多尺度特征提取;多尺度自适应注意力模块通过窗口自注意力机制操作得到多尺度增强特征;自适应通道特征...
  • 本发明提供了一种浮游植物层析序列识别方法及其模型搭建方法,属于图像增强识别技术领域;首先获取浮游植物的显微层析序列数据,进行视场提取与序列化重组,构建立体数据集;接着构建包含物理感知与序列聚合机制的立体识别模型,模型采用参数共享的孪生网络提...
  • 本发明涉及一种用于自动驾驶的激光点云语义分割方法、系统及介质,所述方法包括:M1.激光点云获取与降采样:通过激光雷达传感器,捕获环境中的三维点云数据,并进行预处理与降采样,去除冗余点,保留有代表性的信息点;M2.视锥体素化建模:通过体素化模...
  • 本发明公开了一种面向升船机安全机构监测的语义分割方法,在特征提取阶段采用轻量化的MobileNetV2主干网络替代DeepLabv3+中的Xception结构,显著降低参数规模并提升推理效率;构建融合坐标注意力与通道注意力机制的高效型空洞空...
  • 本发明涉及智慧中医领域,公开了一种基于多光谱的中医舌诊图像增强系统,其技术方案要点是包括图像采集模块、舌体提取与标准化模块、颜色复杂度建模模块、结构纹理分析模块、异常区域分割模块及异常区域智能标注模块。本系统通过结合多光谱成像、颜色复杂度建...
  • 本发明公开了一种基于提示驱动的多标签领域自适应方法,属于计算机视觉技术领域,包括为每个类型生成包含视觉属性、语义层次和共现场景的类别名称的多维度语义文本描述;将包含语义文本描述嵌入到可优化的类别向量中,利用优化的类别向量嵌入到CLIP的文本...
  • 本发明公开了一种基于闭环反馈的图文协同理解与摘要优化方法和装置,特别适用于MuRAG系统。该方法旨在解决现有图文理解系统因"图文分离"处理而导致的语义割裂与信息丢失问题。具体通过构建图像‑文本‑图像的闭环反馈机制,利用多模态大语言模型生成结...
  • 本申请公开了一种透光件的控制方法、眼镜、电子设备、存储介质及产品,本申请涉及智能设备技术领域,本申请实施例中,将获取透光件对应视野区域的图像数据;基于图像数据中的光源进行语义理解,得到目标光源对象;确定目标光源对象在透光件中对应的目标局部区...
  • 本发明公开了一种基于视觉语言大模型的带电作业危险点识别方法、系统、电子设备及存储介质,涉及电力安全技术领域,方法包括:获取原始图像及类型标签;通过图像识别模型获取图像中多个目标及其边界框;计算目标相对距离,并结合类型标签与参考信息库进行匹配...
技术分类