Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 复旦大学;上海兑观信息科技技术有限公司杜响成获国家专利权

复旦大学;上海兑观信息科技技术有限公司杜响成获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉复旦大学;上海兑观信息科技技术有限公司申请的专利基于多尺度特征聚合的场景图像文字检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115965975B

龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211149100.1,技术领域涉及:G06V30/146;该发明授权基于多尺度特征聚合的场景图像文字检测方法是由杜响成;周钊;郑莹斌;金城设计研发完成,并于2022-09-21向国家知识产权局提交的专利申请。

基于多尺度特征聚合的场景图像文字检测方法在说明书摘要公布了:本发明公开了一种基于多尺度特征聚合的场景图像文字检测方法;其包括:提取不同尺度文本图像特征表示,同时获取文字嵌入表示;将多尺度文本图像特征表示聚合后输入堆叠的基于Transformer结构的编码器中,获得加强的多尺度图像特征表示;利用加强的多尺度图像特征表示进行文字嵌入表示的更新;初始化一组查询向量,将加强的多尺度图像特征表示恢复到二维图像特征,将查询向量、二维图像特征和更新的文字嵌入表示同输入解码器中,得到更新的查询向量,再对更新的查询向量与文字嵌入表示进行计算得到文字掩码,最后后处理得到文字检测结果。本发明方法用于场景文本检测准确度高,后处理简单,检测性能优越。

本发明授权基于多尺度特征聚合的场景图像文字检测方法在权利要求书中公布了:1.一种基于多尺度特征聚合的场景文字检测方法,其特征在于,其基于场景文字检测模型进行检测,所述场景文字检测模型包括特征提取模块、堆叠的基于Transformer的编码器和基于Transformer的解码器;具体步骤如下: (1)对原始场景文本图像进行不同尺度的缩放; (2)利用特征提取模块对不同尺度的图像进行特征表示的提取,同时从最大尺度的图像中获取文字嵌入表示; (3)将不同尺度的图像特征表示连同位置编码一起输入堆叠的基于Transformer的编码器中,输出得到加强的多尺度图像特征表示; (4)将文字嵌入表示与加强的多尺度图像特征表示进行可变形注意力计算,更新得到具有更丰富特征的文字嵌入表示; (5)初始化一组查询向量,同时将加强的多尺度图像特征表示恢复到二维图像特征,之后将查询向量、二维图像特征以及更新的文字嵌入表示一起输入基于Transformer的解码器中,输出得到更新的具有文字特征表示的查询向量; (6)基于最后更新得到的查询向量与更新的文字嵌入表示计算得到文字掩码,再经过后处理操作得到检测结果;其中: 步骤(3)中,每个Transformer的编码器单元包含一个多尺度可变形注意力模块和一个前向计算模块;不同尺度的图像特征表示连同位置编码输入基于Transformer的编码器中,多尺度可变形注意力模块对图像特征进行可变形注意力计算,将计算输出的结果与输入的多尺度图像特征进行相加和归一化操作,之后对相加归一化的结果输入前向计算模块,最后对前向计算模块的输入与输出进行相加与归一化操作,得到加强的多尺度图像特征表示; 步骤(6)中,后处理操作具体为:利用非极大抑制算法过滤重复的文字掩码以及区域太小的掩码; 场景文字检测模型训练时,损失函数L由掩码损失函数L mask 和分类损失函数L cls 两部分组成;其中,L mask 是文本实例的掩码二值化损失,由bce损失和dice损失组成,而L cls 是文本与非文本分类预测的损失;损失函数的表示为:,其中,当类别预测为文字时,λ cls =0.4,预测为非文字时,λ cls =0.02; 各个损失计算如下: , , 其中,N和K是查询向量的数量和采样的位置,和分别表示预测的值和真实的值; , 其中l t 和p t 分别表示查询向量Q t 的类别的真实值和类别预测的概率值。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学;上海兑观信息科技技术有限公司,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。