Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京大学;江苏图客机器人有限公司陈力军获国家专利权

南京大学;江苏图客机器人有限公司陈力军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京大学;江苏图客机器人有限公司申请的专利一种基于计算机视觉的图书定位方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114863458B

龙图腾网通过国家知识产权局官网在2025-09-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210328857.0,技术领域涉及:G06V30/416;该发明授权一种基于计算机视觉的图书定位方法是由陈力军;刘佳;徐毅晖;顾桥磊;陈星宇;鄢伟设计研发完成,并于2022-03-31向国家知识产权局提交的专利申请。

一种基于计算机视觉的图书定位方法在说明书摘要公布了:本发明为一种基于计算机视觉的图书定位方法,其包括:步骤S1、通过相机拍照,对图书目标区域进行采集,并存储为图片;步骤S2、构建并训练文本检测模型,用文本区域框标记所述图片中的所有文本;步骤S3、基于文本区域框,对所述图片进行图书实例分割,从而获取图书实例及图书实例在所述图片中的位置信息;步骤S4、构建并训练文本识别模型,对所述文本区域框进行识别,并将同一图书实例中的文本识别结果进行合并,得到每个图书实例的书名识别结果;步骤S5、将所述书名识别结果与读者输入要在书架上进行查询的书籍名称进行匹配,输出目标书籍在所述图片中的定位结果。通过上述方法,本申请实现了高效率和高准确性的图书定位,提高了借书效率。

本发明授权一种基于计算机视觉的图书定位方法在权利要求书中公布了:1.一种基于计算机视觉的图书定位方法,其特征在于,所述方法包括: 步骤S1、通过相机拍照,对图书目标区域进行采集,并存储为图片; 步骤S2、构建并训练文本检测模型,用文本区域框标记所述图片中的所有文本; 步骤S3、基于文本区域框,对所述图片进行图书实例分割,从而获取图书实例及图书实例在所述图片中的位置信息; 步骤S4、构建并训练文本识别模型,对所述文本区域框进行识别,并将同一图书实例中的文本识别结果进行合并,得到每个图书实例的书名识别结果; 步骤S5、将所述书名识别结果与读者输入要在书架上进行查询的书籍名称进行匹配,输出目标书籍在所述图片中的定位结果; 所述步骤S2中构建并训练文本检测模型的方法包括: 步骤S21、对人工合成、真实场景文本检测数据集都进行数据增强;使用的数据增强包括随机改变图像的亮度、颜色、对比度特征,对图片进行随机旋转与裁剪,并把图片宽度都缩放到固定像素,长宽比保持不变; 步骤S22、基于EAST模型,构建文本检测模型;基于EAST模型,以ResNet-50为骨干网络构建文本检测模型,修改模型对于“下”边界的定义,所述“下”边界的定义为文本框底线,并实现可GPU加速非极大值抑制算法,提高模型训练及推理效率; 步骤S23、基于增强后的文本检测数据集,训练EAST模型:先让模型在人工合成数据集上完成预训练,再让模型在真实场景数据集中微调,得到健壮的文本检测模型; 所述步骤S3中,所述图书实例分割的方法包括: 步骤S31、用五个参数{di|i∈{1,2,3,4}},θ对书脊框进行定义,对于一个给定的书脊框内部点v,di表示内部点v到书脊框四条边的距离,θ表示书脊框与水平方向的夹角; 步骤S32、对所述图片应用直线段检测算法,对原始图片应用直线段检测算法LSD,提取图片中连贯的长线段,输出线段图,并通过线段图生成单位法线图; 步骤S33、定义书脊框能量函数;基于线段图与法线图,定义书脊框能量函数如下: 其中,p∈ei表示p为线段ei中的一个像素;代表ei的单位法向量;Lp为p在线段图中的取值,该值范围为[0,255];Np为p在单位法线图中的取值; 该能量函数能让书脊框的各边贴合线段图,并且书脊框各边法向量与法线图方向一致时,达到最小; 步骤S34、将所述文本区域框作为初始的书脊框,不断向外扩大书脊框,直至能量函数达到最小,输出此时的书脊框,并进行筛选。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学;江苏图客机器人有限公司,其通讯地址为:210023 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。