Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种面向遥感影像跨域语义分割的测试时自适应方法、系统、设备及介质,方法包括以下步骤:获取在源域数据集的初始语义分割模型,以及目标域图像;基于所述初始语义分割模型初始化教师网络和学生网络;通过教师网络对所述目标域图像进行预测,生成...
  • 本发明提供了一种面向高分辨率水下光学图像的海洋生物分割方法,包括:步骤S1,采集多幅高分辨率水下光学图像和海洋生物标签并划分为训练集和测试集;步骤S2,于训练集中抽取一幅髙分辨率水下光学图像输入至海洋生物分割网络中进行空间特征提取、语义特征...
  • 本发明提供了一种统一足球视觉基础系统及其应用方法,包括:数据自动标注模块和模型训练与推理模块;数据自动标注模块将原始视频转换为结构化的多任务标注数据,与现有数据集进行整合获得综合训练数据集;模型训练与推理模块根据综合训练数据集优化模块参数,...
  • 本发明公开了一种占据栅格真值数据生成方法及电子设备。该方法包括获取车辆周围的多帧环境数据和关键帧的标注框;将多帧图像数据和原始点云数据分别进行处理对应得到图像语义分割结果和去噪后的点云数据;基于关键帧中每个交通参与目标的标注框以及每一帧的车...
  • 本发明公开了一种基于最短路径搜索的隧道图像裂缝半自动标注方法及系统,涉及图像标注技术领域。该方法包括步骤:获取隧道裂缝图像样本,利用最小路径搜索方法计算隧道裂缝图像样本中带有初始标注的初始最优路径,其中,将隧道裂缝图像样本建模为图结构,根据...
  • 本发明涉及人工智能与医疗影像处理交叉技术领域,具体为一种基于小波桥扩散模型和高效条件随机场的医学图像分割系统及方法,构建WBDM‑ECRF框架,包括离散小波变换、BDM‑T、BDM‑S和ECRF模块;离散小波变换分解图像并提取低频子带,增强...
  • 本公开提供了一种视频标注方法、装置、设备和计算机程序产品,涉及视频处理技术领域。其中,本公开中的视频标注方法包括:获取目标视频;基于初步标注策略对所述目标视频进行标注,获得视频标注数据,所述初步标注策略包括用于进行视频标注的标注工具和/或配...
  • 本申请提供一种多模态数据协同的数据标注方法、系统和设备,属于数据标注技术领域,本申请通过获取目标商品的彩色图片、表面属性文本数据及通过向商品表面投射编码光栅图案并从不同角度捕捉变形图像得到的变形光栅图像序列;通过对文本数据进行语义分析提取表...
  • 本申请涉及模型优化、金融科技以及医疗健康技术领域,公开了一种基于注意力头动态抑制视觉语言模型的描述文本生成方法及装置、存储介质、计算机设备,包括:接收待处理图像和文本指令,将待处理图像编码为多个视觉token,将文本指令编码为初始文本tok...
  • 本公开提供一种文件处理方法、装置、存储介质及程序产品,涉及图像处理技术领域,有利于提高图像处理效率。该方法包括:获取待解码文件,待解码文件包括图像以及图像的关联信息,图像的关联信息用于描述图像或图像的目标区域内的特征属性;对待解码文件进行解...
  • 本发明提供一种智能地理位置标记与敏感区域实时检测方法及设备,属于地理位置标记安全技术领域,本发明采集地标多角度图像并提取特征构建指纹库;捕获网络图像后提取特征,通过索引检索、相似度计算、独特特征验证及辅助线索校验匹配候选地标;计算置信度,结...
  • 本发明提供一种数据采集方法、装置、电子设备及存储介质,涉及数据处理技术领域,获取待采集书本的实体信息,根据预设的层级编码规则对实体信息进行编码,生成待采集书本对应的唯一标识码;基于预设的多个采集维度及每个维度的参数范围,生成采集参数组合,根...
  • 本发明提出一种融合大语言模型的区域风场多源异构工单数据快速结构化系统,包含多个模块,数据输入模块接收各类工单图像;OCR布局识别模块对其全面识别,提取关键信息并确定空间位置,输出带坐标的文本片段与版面锚点信息,规则字段提取模块从中识别格式类...
  • 本申请实施例公开了一种图像处理方法、装置、存储介质以及电子设备,方法包括:首先对待翻译文本图像进行图像去畸变处理得到畸变矫正文本图像,以消除待翻译文本图像的畸变问题,然后进行字符识别处理得到字符识别信息,进行文本布局识别处理得到文本布局结构...
  • 本发明提供了一种基于PDF文档的表格提取方法及系统,涉及数据处理技术领域,包括获取PDF文档并对每一页进行解析,得到页面中所有文本块和线条元素的位置信息,并计算文本块在页面中的局部密度参数和每一页的页面结构一致性指数;对PDF文档的单页表格...
  • 本申请公开了一种文档处理方法、装置、设备及介质,用以最大程度快捷准确地对文档进行处理。在该方法中,针对待处理的文档,可以先识别文档的布局信息;基于布局信息,对文档进行初步分块,得到初分文本块;之后,针对相邻的每两个初分文本块,可以基于该两个...
  • 本发明提供了一种基于多尺度自蒸馏机制的农资标签文字检测方法和系统,属于标签文字检测技术领域,其方法包括,采集和预处理农资标签图像基于预处理后的农资标签图像对高性能模型进行训练;将训练完成后的高性能模型作为教师模型,并冻结参数;构建学生模型,...
  • 本发明涉及计算机视觉与人工智能技术领域,具体为基于视觉语言大模型的知识引导式表计读数方法及系统,包括:模版获取步骤:获取表计图像,基于类型调取包含元数据及推理逻辑指令的结构化读数提示模版;多模态输入步骤:将图像与模版作为多模态数据输入视觉语...
  • 本发明公开了一种基于自监督的文本识别微调方法及装置,属于计算机视觉与光学字符识别技术领域。本发明采用有监督合成数据预训练+真实无标签数据自监督迭代优化的闭环方案:先通过含标签合成数据集训练初代教师模型,再利用该模型为真实无标签数据生成伪标签...
  • 本申请实施例提供了一种多模态识别模型的训练、检测与识别方法及其相关设备。多模态弯曲文本识别模型的训练方法,包括:获取包含多语种弯曲形状文本的图像数据集;为图像数据集生成标注信息,标注信息包括文本区域的几何位置、字符内容、阅读顺序和字符类型;...
技术分类