北京理工大学宋大为获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利基于拼写检查的中文文本纠正方法、装置以及计算机设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119886116B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411643354.8,技术领域涉及:G06F40/232;该发明授权基于拼写检查的中文文本纠正方法、装置以及计算机设备是由宋大为;聂之蘖;吴海明设计研发完成,并于2024-11-18向国家知识产权局提交的专利申请。
本基于拼写检查的中文文本纠正方法、装置以及计算机设备在说明书摘要公布了:本发明涉及中文文本纠正技术领域,特别涉及一种基于拼写检查的中文文本纠正方法、装置、计算机设备以及存储介质,通过从特定领域的文档文本中提取出领域特征信息,构建特定领域检索文本,以及从特定领域的案例池中提取出相关纠正案例,构建特定领域案例模板,结合待纠正中文文本以及特定领域检索文本、特定领域案例模板,作为输入数据传递给预训练模型,通过引入外部的领域知识以及相关纠正案例作为演示,指导语言模型进行准确文本纠正,防止语言模型生成过多与文本纠正结果无关的信息,提高语言模型对特定领域字符出现错误情况的识别和纠正的准确性。
本发明授权基于拼写检查的中文文本纠正方法、装置以及计算机设备在权利要求书中公布了:1.一种基于拼写检查的中文文本纠正方法,其特征在于,包括以下步骤: 获得待纠正中文文本以及所述待纠正中文文本的特定领域的文档文本,其中,所述文档文本包括若干个文档块文本; 对所述待纠正中文文本以及若干个文档块文本进行特征提取,获得所述待纠正中文文本以及若干个文档块文本的特征向量,其中,所述特征向量包括语义特征向量、拼音特征向量以及视觉形态特征向量; 根据所述待纠正中文文本以及若干个文档块文本的特征向量,分别将所述待纠正中文文本以及同一个文档块文本的语义特征向量、拼音特征向量以及视觉形态特征向量进行拼接,获得所述待纠正中文文本以及若干个文档块文本的原始多模态向量,对所述原始多模态向量进行维度转换,获得所述待纠正中文文本以及若干个文档块文本的最终多模态向量; 根据所述待纠正中文文本以及若干个文档块文本的最终多模态向量,获得所述待纠正中文文本与若干个文档块文本之间的相似度,根据所述相似度,从若干个所述文档块文本中提取若干个目标文档块文本,构建所述待纠正中文文本的特定领域检索文本; 构建所述待纠正中文文本的特定领域的案例池,其中,所述案例池包括若干组特定文本样例; 根据所述待纠正中文文本,从所述特定领域的案例池中提取若干组目标特定文本样例,构建所述待纠正中文文本的特定领域案例模板; 将所述待纠正中文文本以及所述待纠正中文文本的特定领域检索文本、特定领域案例模板进行组合,构建待纠正中文文本指令序列;将所述待纠正中文文本指令序列输入至预训练的大语言模型进行文本纠正,获得所述待纠正中文文本的纠正结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100080 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励