联仁健康医疗大数据科技股份有限公司聂金苗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉联仁健康医疗大数据科技股份有限公司申请的专利一种文本纠错方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115455940B 。
龙图腾网通过国家知识产权局官网在2026-01-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211158604.X,技术领域涉及:G06F40/211;该发明授权一种文本纠错方法、装置、电子设备及存储介质是由聂金苗设计研发完成,并于2022-09-22向国家知识产权局提交的专利申请。
本一种文本纠错方法、装置、电子设备及存储介质在说明书摘要公布了:本发明公开了一种文本纠错方法、装置、电子设备及存储介质。基于图像识别模块识别待处理图像中的文字信息以及文字信息的置信度;当检测到存在置信度低于预设置信度阈值的待纠错文字时,获取与待纠错文字相邻的已识别文字;根据与待纠错文字相关联的待选择文字,确定与待纠错文字相对应的待纠错文字编码;基于各已识别文字所对应的已识别文字编码以及待纠错文字编码,确定目标语句编码;将目标语句编码输入至文字预测模型中,得到目标语句;基于目标语句中的预测文字替换待纠错文字,解决了人工纠错和机器学习的算法实现文本纠错过程中,成本较高,效率低的技术问题,提升了文本纠错的准确率和效率,提高了用户阅读文本的流畅性。
本发明授权一种文本纠错方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文本纠错方法,其特征在于,包括: 基于图像识别模块识别待处理图像中的文字信息以及所述文字信息的置信度; 当检测到存在置信度低于预设置信度阈值的待纠错文字时,获取与所述待纠错文字相邻的至少两个已识别文字; 根据与所述待纠错文字相关联的至少一个待选择文字,确定与所述待纠错文字相对应的待纠错文字编码;其中,所述待纠错文字编码是基于对待纠错文字相关联的多个待选择文字进行编码所得的编码内容; 基于各已识别文字所对应的已识别文字编码以及所述待纠错文字编码,确定目标语句编码; 将所述目标语句编码输入至预先训练得到的文字预测模型中,得到目标语句;其中,所述目标语句中包括对所述待纠错文字相对应的预测文字; 基于所述目标语句中的预测文字替换所述待纠错文字; 其中,所述根据与所述待纠错文字相关联的至少一个待选择文字,确定与所述待纠错文字相对应的待纠错文字编码,包括: 基于预先设置语料库确定与所述待纠错文字相关联的至少一个待选择文字,以及各待选择文字在文本中所对应的待选择置信度;其中,所述语料库中文字与文字之间按照字形、字义或字音划分为多组;所述待选择文字基于待纠错文字的形近字列表选取;所述形近字列表是基于各文字的置信度,或基于将各文字插入到文本中的置信度,选择置信度排名前n的文字组成;所述待选择置信度为选择当前待选择文字替代待纠错文字,当前待选择文字为正确代替文字的可能性; 基于各待选择文字和相应的待选择置信度,确定与各待选择文字所对应的待选择文本编码,包括:对各待选择文字在文本中所对应的待选择置信度进行排序,选择排名靠前的前m个待选择文字,分别计算所述前m个待选择文字的编码和其置信度的乘积,得到与前m个待选择文字各自所对应的待选择文本编码; 基于各待选择文本编码,确定待使用文字编码;其中,所述待使用文字编码是将各待选择文本编码进行相加所得到的最终结果; 基于所述待使用文字编码、所述待纠错文字隶属于目标语句的位置编码以及分割编码,确定与所述待纠错文字所对应的待纠错文字编码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人联仁健康医疗大数据科技股份有限公司,其通讯地址为:200131 上海市浦东新区中国(上海)自由贸易试验区川和路55弄3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励