Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华东师范大学齐沛航获国家专利权

华东师范大学齐沛航获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华东师范大学申请的专利一种基于掩膜约束的文档布局分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115761779B

龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211529742.4,技术领域涉及:G06V30/418;该发明授权一种基于掩膜约束的文档布局分析方法是由齐沛航;贺樑;肖路巍;吴兴蛟;马天龙设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。

一种基于掩膜约束的文档布局分析方法在说明书摘要公布了:本发明公开了一个基于掩膜约束的文档布局分析方法,用检测方法处理文档布局分析存在的语义差距缺陷,属于数字图像处理技术领域。本发明提出了一个新颖的MASK约束聚合算法来确保输入中的全局语义信息能够得到进一步挖掘并解决MASKR‑CNN处理后的边界框重叠的问题。最后,本发明使用具有复杂布局的文档基准数据集作为验证指标DSSE‑200,FPD,结果表明本发明提出的方法可以取得明显的性能提升。

本发明授权一种基于掩膜约束的文档布局分析方法在权利要求书中公布了:1.一种基于掩膜约束的文档布局分析方法,其特征在于,包括以下步骤: 步骤1:将MaskR-CNN的物体检测框架整合到图像内部的分割中; 步骤2:将输入图像的MASK与原始图像叠加,然后将图像的RGB通道信息再次叠加到MaskR-CNN的输出,形成一个具有4个通道的输入物体; 步骤3:将输入物体放入MASK约束中,最终得到一个通道数为6的输出结果; 步骤4:使用基于深度图分割的图像背景估计方法,即约束聚合算法得到预测结果;其中: 所述步骤3,具体为: 3.1:构建一个金字塔池模型,以更全面地使用4通道输入; 3.2:为了提取不同感受野的信息,每次卷积都将输入升维为8个通道,共得到32个通道的输出; 3.3:采用自适应平均池,提取了整个输入的全局信息来更有效地实现全局信息; 3.4:将得到的32个通道的特征信息联系起来,然后让它们经过1×1卷积运算降维,将通道数变为8; 3.5:将运算结果再次经过3×3卷积运算,通道数保持不变仍为8; 3.6:最后利用1×1卷积运算,用6个卷积核将通道数降为6作为输出结果; 步骤4所述使用基于深度图分割的图像背景估计方法,即约束聚合算法得到预测结果,具体为: 4.1:将步骤3的输出结果中未被归类为背景的所有坐标点放入一个列表中; ;取img中mask1为0的rgb值的模式rgb_b; 4.2:从列表中的任何一点开始使用RGB数字运算搜索其四个邻域中是否有类似的点,如果有类似的点,继续搜索并将搜索到的点移出列表;枚举所有在img中mask1不为0且rgb_b距离大于t的点x;将周围rgb距离扩张为t,mask1为0的点的mask2值为; 4.3:如果没有,返回;然后继续搜索列表中的其他点,直到列表为空; 将返回; 4.4:将找到的区域合并输出得到预测结果;具体形式为: 输入::原始图像,:原始图像掩膜,t:阈值; 输出::最终预测; 损失函数如下: ; 其中: 为像素i的目标类别标签; 为像素i和类别的预测后验概率; 阈值的设置是为了只选择损失最大的前K个像素; 设置K=0.2×N。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。