北京蓝太平洋科技股份有限公司请求不公布姓名获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京蓝太平洋科技股份有限公司申请的专利一种文本错别字检测方法和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115759076B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111627033.5,技术领域涉及:G06F40/289;该发明授权一种文本错别字检测方法和设备是由请求不公布姓名设计研发完成,并于2021-12-28向国家知识产权局提交的专利申请。
本一种文本错别字检测方法和设备在说明书摘要公布了:本发明公开了一种文本错别字检测方法,包括:读取目标文本,将目标文本输入至预先训练完成的分词模型,并输出分词结果,分词结果包括多个词项;将每一词项分别在文本库中进行组词查找匹配,以检测当前词项是否为错别词项;若是,基于最小编辑距离算法模型分别构建错别词项与多个目标词项之间的多个距离矩阵,根据每一距离矩阵计算每一目标词项与错别词项之间的操作成本,并根据操作成本对所述错别词项进行纠错。本发明可以对目标文本中的错别字,例如拼写错误或语法错误进行自动检测,并在检测到错别词项后自动对该错别词项进行纠错,提高了文本编辑效率。
本发明授权一种文本错别字检测方法和设备在权利要求书中公布了:1.一种文本错别字检测方法,其特征在于,包括: 读取目标文本,将所述目标文本输入至预先训练完成的分词模型,并输出分词结果,所述分词结果包括多个词项; 将每一词项分别在文本库中进行组词查找匹配,以检测当前词项是否为错别词项,包括: 将每一词项分别与其前向词项和后向词项进行组词,对应生成第一前向词组和第一后向词组; 在文本库中查找是否存在与所述第一前向词组和所述第一后向词组匹配的词组,若所述文本库中所述第一前向词组和所述第一后向词组同时存在,则当前词项为非错别词项,若所述文本库中所述第一前向词组或所述第一后向词组存在,则当前词项为疑似错别词项,若所述文本库中所述第一前向词组或所述第一后向词组均不存在,则当前词项为错别词项; 若是,基于最小编辑距离算法模型分别构建所述错别词项与多个目标词项之间的多个距离矩阵,根据每一距离矩阵计算每一目标词项与所述错别词项之间的操作成本,并根据操作成本对所述错别词项进行纠错,包括: 基于最小编辑距离算法分别构建错别词项与多个目标词项之间的距离矩阵,所述距离矩阵的计算公式如下: 其中,表示第i行第j列的距离矩阵,表示第i-1行第j列的距离矩阵,表示删除操作成本,表示第i行第j-1列的距离矩阵,表示插入操作成本,表示第i-1行第j-1列的距离矩阵,表示替换操作成本,表示错别词项在第i行的字符数据,表示某一目标词项在第j列的字符数据; 按照操作成本由低到高的顺序,将每一目标词项分别与所述错别词项的前向词项和后向词项进行组词,得到第二前向词组和第二后向词组,直到某一第二前向词组和对应的第二后向词组在文本库中同时存在时,得到所述错别词项的正确词项。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京蓝太平洋科技股份有限公司,其通讯地址为:100000 北京市海淀区唐家岭村南2幢楼房一层8135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。