昆明理工大学李英获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119808768B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411875510.3,技术领域涉及:G06F40/253;该发明授权一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统是由李英;李源;余正涛设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统在说明书摘要公布了:本发明涉及一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统。本发明将音似错误融合到提示指令中,从而构建音似错误约束的指令集;然后利用指令集引导开源大模型ChatGLM自动生成候选缅甸语语法纠错语料,并对生成的缅甸语语法纠错语料进行后处理;最后将大模型生成的纠错语料和语音识别模型生成的纠错语料融合来缓解缅甸语纠错语料匮乏的问题,同时尝试通过微调预训练语言模型mBART进一步提升缅甸语纠错性能。本发明通过有效利用开源大模型ChatGLM对自然语言进行高度理解和处理的特性来自动生成缅甸语语法纠错语料,在缅甸语语法纠错任务上尤其是对于音似错误的任务上取得了较好的实验结果。
本发明授权一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法、系统在权利要求书中公布了:1.一种基于音似错误引导的大模型缅甸语语法纠错语料构建方法,其特征在于:所述方法包括: 步骤1:基于语音识别的缅甸语纠错语料中的音似错误例子引导开源大模型生成用于缅甸语语法纠错语料构建的提示指令; 步骤2:利用融合了音似错误的提示指令引导开源大模型生成缅甸语语法纠错语料; 步骤3:对上一步生成的缅甸语语法纠错语料进行后处理操作; 步骤4:使用预训练语言模型测试开源大模型生成缅甸语语法纠错语料与语音识别语料混合而成的语料的纠错效果; 所述步骤1的具体步骤如下: 步骤1.1:选择ChatGLM开源大模型作为缅甸语语法纠错语料构建的基础模型; 步骤1.2:将ChatGLM开源大模型部署为API接口方便调用; 步骤1.3:在语音识别的缅甸语纠错语料上,分析语音识别模型生成的纠错语料中的音似错误分布情况,人工筛选出包含音似错误的缅甸语语法错误例子;利用筛选出来的例子构建出思维链来引导ChatGLM开源大模型生成用于缅甸语语法纠错语料构建的提示指令; 所述步骤3的具体步骤如下: 步骤3.1:对缅甸语语法纠错语料进行数据清洗,删除缅甸语语法纠错语料中的特殊符号、字符间多余的空格、不出现缅甸语字符的数据行和长度短的无用文本; 步骤3.2:对于生成的缅甸语语法纠错语料中的句子,在等概率的条件下,在句子中插入一定数量的词语,将其中一定数量的词语进行同义词替换,随机交换其中一定数量的词语,以概率随机删除其中词语,保持原句子意思不变。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励