Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 复旦大学陈智能获国家专利权

复旦大学陈智能获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉复旦大学申请的专利基于掩码扩散模型的图像文本识别方法、系统、存储介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121095960B

龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511604134.9,技术领域涉及:G06V30/19;该发明授权基于掩码扩散模型的图像文本识别方法、系统、存储介质及设备是由陈智能;姜育刚;杜永坤;李枳贤设计研发完成,并于2025-11-05向国家知识产权局提交的专利申请。

基于掩码扩散模型的图像文本识别方法、系统、存储介质及设备在说明书摘要公布了:本发明提供了一种基于掩码扩散模型的图像文本识别方法、系统、存储介质及设备,属于图像或视频识别或理解技术领域。本发明通过视觉编码器提取图像的多尺度视觉特征,结合掩码扩散解码器,在训练阶段采用多样化掩码策略与随机字符替换扰动,分别计算去噪损失和自反思损失,联合优化模型;在推理阶段,从全掩码状态出发,通过多轮迭代去噪恢复完整文本序列。本发明突破了传统自回归模型的单向建模限制,实现了全方位的上下文依赖建模,并引入自反思纠错机制与块低置信度掩码策略,显著提升了在遮挡、模糊等复杂场景下的识别准确率与推理效率。本发明的方法在多个公开数据集上达到领先水平,兼具高精度与高速度的优点。

本发明授权基于掩码扩散模型的图像文本识别方法、系统、存储介质及设备在权利要求书中公布了:1.一种基于掩码扩散模型的图像文本识别方法,其特征在于, 所述掩码扩散模型包括视觉编码器和掩码扩散解码器,所述图像文本识别方法基于训练集进行训练,从而实现待识别图像文本的文本识别,所述训练集包含多个训练样本,每个所述训练样本包括一个待训练图像文本及其对应的字符序列Ytraining, 所述图像文本识别方法包括以下步骤: S10,使用所述视觉编码器从所述待训练图像文本中提取出多尺度的视觉特征表示; S20,随机选取一种掩码策略对Ytraining进行掩码得到带噪声的字符序列并将其转换为标记表示Tm,最后将Tm与输入所述掩码扩散解码器进行去噪以学习文本结构后计算去噪损失; S30,对Ytraining进行随机字符替换扰动生成扰动序列后将其转换为标记表示Tr,随后将Tr与输入所述掩码扩散解码器进行纠错并计算自反思损失; S40,使用和对所述掩码扩散解码器进行联合优化并重复步骤S20~S30直至其收敛; S50,使用所述视觉编码器从所述待识别图像文本中提取出多尺度的视觉特征表示; S60,对所述待识别图像文本对应的目标序列从全掩码状态开始,以和所述全掩码状态下的初始掩码序列对应的标记表示作为输入,通过步骤S40训练好的所述掩码扩散解码器进行多轮迭代去噪,最终恢复出所述目标序列的完整的识别文本序列。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。