吉首大学陈炳权获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉吉首大学申请的专利一种秦简文字文本识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120564207B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510740077.0,技术领域涉及:G06V30/19;该发明授权一种秦简文字文本识别方法是由陈炳权;汪开航;文乐;田明辉;吴杰;杨喜设计研发完成,并于2025-06-04向国家知识产权局提交的专利申请。
本一种秦简文字文本识别方法在说明书摘要公布了:本发明提供了一种秦简文字文本识别方法,通过一训练完成的文本识别模型识别未知秦简文字文本的预测文本表意,文本识别模型基于训练数据集训练得到;文本识别模型在训练过程中使用到一仿造秦简文字文本数据集,该仿造秦简文字文本数据集中的样本秦简文字文本基于一仿造秦简文字文本生成模型仿造;仿造秦简文字文本生成模型包括造词句模组和图像拼接模组,造词句模组用于生成符合对应秦简文字文本语序的仿造词句,图像拼接模组用于根据仿造词句生成样本秦简文字文本。在数量充足且真实性较高的仿造数据的训练下,文本识别模型具有良好的秦简文字文本识别效果,该秦简文字文本识别方法再实际应用中具有良好的识别准确性。
本发明授权一种秦简文字文本识别方法在权利要求书中公布了:1.一种秦简文字文本识别方法,其特征在于,通过一训练完成的文本识别模型识别未知秦简文字文本的预测文本表意,所述文本识别模型基于训练数据集训练得到; 所述训练数据集,其中,为真实秦简文字文本数据集,为仿造秦简文字文本数据集,为编号为的样本秦简文字文本数据,每一条所述样本秦简文字文本数据包括样本秦简文字文本和对应的文本表意,所述样本秦简文字文本的数据形式为高度相同的灰度图像; 在所述真实秦简文字文本数据集中,所述样本秦简文字文本数据中的样本秦简文字文本基于截取真实秦简文字文本得到; 在所述仿造秦简文字文本数据集中,所述样本秦简文字文本数据中的样本秦简文字文本基于一仿造秦简文字文本生成模型实现; 所述仿造秦简文字文本生成模型包括造词句模组和图像拼接模组,所述造词句模组用于生成符合秦简文字文本语序的仿造词句,所述图像拼接模组用于根据所述仿造词句生成满足所述样本秦简文字文本数据形式的样本秦简文字文本; 所述造词句模组的训练过程包括:S301、基于提取器在真实秦简文字文本中提取出若干条真实秦简文字子文本及对应的表意,储存至一真实秦简文字子文本数据库中;S302、对所述真实秦简文字文本中的单字和单词进行表意的提取,并按序编号储存于一字词表中;S303、从所述真实秦简文字子文本数据库中随机提取出一条所述真实秦简文字子文本,并根据所述字词表中的编号,将所述真实秦简文字子文本的表意转换为索引序列;S304、基于Embedding层将所述索引序列映射为低维稠密向量;S305、基于LSTM层对所述低维稠密向量进行逐时间部处理,得到关于所述低维稠密向量中所有时间部的隐状态;S306、基于全连接层将所述低维稠密向量对应的所有时间部的隐状态映射为所述字词表中的概率分布;S307、比较所述概率分布与真实标签之间的损失并通过反向传播方式调整所述LSTM层、Embedding层和全连接层;S308、重复执行步骤S303至步骤S307直至所述造词句模组训练完毕。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人吉首大学,其通讯地址为:416099 湖南省湘西土家族苗族自治州吉首市人民南路120号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励