华东师范大学陆雪松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华东师范大学申请的专利一种基于归因网络和BERT的中文字符纠正方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115809655B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111073538.1,技术领域涉及:G06F40/216;该发明授权一种基于归因网络和BERT的中文字符纠正方法及系统是由陆雪松;陈贝设计研发完成,并于2021-09-14向国家知识产权局提交的专利申请。
本一种基于归因网络和BERT的中文字符纠正方法及系统在说明书摘要公布了:本发明公开了一种基于归因网络和BERT的中文字符纠正方法,所述方法包括如下步骤:收集包含错误字符的中文文本数据集,并将数据集划分为训练集和测试集,用于模型的训练和测试,或用完整的数据集进行训练;训练用作归因网络的基于BERT的二分类模型;利用训练获得的二分类模型对训练集中的句子进行前馈计算,输出记作FX;用上述输出FX对X求梯度得到错误归因信息;设置阈值过滤器对上述获得的错误归因信息进行处理;将过滤处理后的错误归因信息融入第二个BERT模型中,进行字符纠正训练;预测错误字符的目标字符。本发明还公开了一种实现上述方法的系统。本发明方法能够显著提高中文文本纠错领域的精确率和召回率,同时具有很强的通用性和可扩展性。
本发明授权一种基于归因网络和BERT的中文字符纠正方法及系统在权利要求书中公布了:1.一种基于归因网络和BERT的中文字符纠正方法,其特征在于,所述方法包括如下步骤: 步骤一、收集包含错误字符的中文文本数据集,并将数据集划分为训练集和测试集,所述训练集用于训练模型,所述测试集用于评价模型效果;或用完整数据集进行模型训练; 步骤二、训练用作归因网络的基于BERT的二分类模型; 步骤三、利用步骤二中训练获得的二分类模型对训练集中的句子进行前馈计算,输出记作FX,X为输入的句子; 步骤四、用步骤三中的输出FX对X求梯度得到错误归因信息; 步骤五、设置阈值过滤器对步骤四中获得的错误归因信息进行处理; 步骤六、将步骤五中过滤后的错误归因信息融入第二个BERT模型中,利用所述中文数据集中的正误句对,进行字符纠正训练; 步骤七、推理阶段,当获得新的需要进行中文字符纠正的句子时,先利用步骤二中的BERT模型计算句子的错误归因信息,再利用步骤六中的BERT模型,结合错误归因信息预测句子中每个错误字符的目标字符。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。