西安理工大学刘雅君获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安理工大学申请的专利基于增量学习的中文文献分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119939428B 。
龙图腾网通过国家知识产权局官网在2025-08-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510022875.X,技术领域涉及:G06F18/2431;该发明授权基于增量学习的中文文献分类方法是由刘雅君;秋露露;上官安琪;费蓉;李军怀设计研发完成,并于2025-01-07向国家知识产权局提交的专利申请。
本基于增量学习的中文文献分类方法在说明书摘要公布了:本发明提供了一种基于增量学习的中文文献分类方法,具体包括:构建中文文献分类问题的基准数据集:构建基于增量学习的中文文献分类的基准模型:使用羊群选择算法选取旧类别中具有代表性的数据,和新类别数据合并,构建增量学习数据集:将增量学习数据集输入到基准模型中,在增量学习损失函数约束下进行训练:使用权重对齐方法对基准模型中的全连接层的输出为新类别的权重进行更新;最后将待分类中文文献输入到全连接层权重对齐后的模型中,进行文本信息识别,得到文献分类结果。本发明可用于鉴定中文文献的类别,使用权重对齐方法和解耦的蒸馏损失函数,使得多分类问题结果更为可靠和可信,降低系统误差。
本发明授权基于增量学习的中文文献分类方法在权利要求书中公布了:1.一种基于增量学习的中文文献分类方法,其特征在于,包括: 步骤S1,构建中文文献分类问题的基准数据集; 步骤S2,构建基于增量学习的中文文献分类的基准模型; 所述步骤S2中的基准模型由编码层、卷积层、激活层、最大池化层、注意力层和全连接层依次连接组成,具体包括: 步骤S21:设置编码层,使用BERT-wwm-ext,Chinese中文预训练语言模型获得中文文献文本数据的嵌入表示,作为后续模型的输入; 步骤S22:设置卷积层,使用不同大小的卷积核在文本向量上滑动,以捕捉不同长度的局部特征; 步骤S23:设置激活层,使用ReLU激活函数对卷积后获取的特征进行激活; 步骤S24:定义最大池化层,对特征进行降维处理,提取最重要的特征; 步骤S25:设置注意力层,获得每个特征的权重,再与原始特征相乘; 步骤S26:定义全连接层,用来得到模型的分类结果; 步骤S3,使用羊群选择算法选取旧类别中具有代表性的样本,和新类别数据合并,构建增量学习数据集; 步骤S4,将增量学习数据集输入到基准模型中,在增量学习损失函数约束下进行训练; 步骤S5,使用权重对齐方法对基准模型中的全连接层的输出为新类别的权重进行更新; 步骤S6,将待分类中文文献输入到全连接层权重对齐后的模型中,进行序列信息识别,得到文献分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安理工大学,其通讯地址为:710048 陕西省西安市碑林区金花南路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。