阿里巴巴(中国)有限公司赵磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴(中国)有限公司申请的专利一种训练分类模型、对文本分类的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116304015B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211570814.X,技术领域涉及:G06F16/353;该发明授权一种训练分类模型、对文本分类的方法及装置是由赵磊设计研发完成,并于2022-12-07向国家知识产权局提交的专利申请。
本一种训练分类模型、对文本分类的方法及装置在说明书摘要公布了:本申请提供了一种训练分类模型、对文本分类的方法及装置。使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型。可以提高分类模型对更多表述方式的文本分类的准确率、对具有更少量字符的文本分类的准确率以及对具有“输入文本以及模板文本”的文本中的输入文本以及提示文本预测用于在分类标签填写位上填写的输入文本的分类标签的准确率,如此,可增加的分类模型的鲁棒性以及健壮性等,进而可提高分类模型对文本分类的准确率。
本发明授权一种训练分类模型、对文本分类的方法及装置在权利要求书中公布了:1.一种训练分类模型的方法,其特征在于,所述方法包括: 获取预训练的语言模型;获取原始训练文本以及原始训练文本的原始分类标签,原始训练文本中至少具有原始输入文本以及模板文本,模板文本中包括提示文本以及分类标签填写位;原始训练文本的原始分类标签是至少根据原始输入文本的分类标签得到的; 根据原始训练文本以及原始分类标签获取掩码训练文本以及掩码训练文本的掩码分类标签;掩码训练文本中至少具有掩码输入文本以及模板文本,掩码输入文本是在原始训练文本中对原始输入文本中的至少一个字符掩码后得到的,掩码分类标签是至少根据原始分类标签得到的和或至少根据原始输入文本中的被掩码的至少一个字符得到的; 根据原始训练文本以及原始分类标签获取一致性训练文本以及一致性训练文本的一致性分类标签;一致性训练文本中至少具有模板文本以及与原始输入文本语义相关的一致性输入文本;一致性输入文本中的字符与原始输入文本中的字符不全相同,一致性分类标签是至少根据原始分类标签得到的; 至少使用原始训练文本、原始分类标签、掩码训练文本、掩码分类标签、一致性训练文本以及一致性分类标签,对预训练的语言模型进行针对分类标签填写位的分类预测任务的优化学习,得到分类模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴(中国)有限公司,其通讯地址为:310012 浙江省杭州市余杭区五常街道文一西路969号3幢5层554室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励