安徽大学马海平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利一种标签信息增强与强负样本驱动的分类预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119004174B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411049070.6,技术领域涉及:G06F18/24;该发明授权一种标签信息增强与强负样本驱动的分类预测方法是由马海平;张洁佩;王长乾;张云飞;张兴义设计研发完成,并于2024-08-01向国家知识产权局提交的专利申请。
本一种标签信息增强与强负样本驱动的分类预测方法在说明书摘要公布了:本发明公开了一种标签信息增强与强负样本驱动的分类预测方法,其步骤包括:首先,通过文本截断和匹配习题集内容,构造高质量文本;接着,考虑情感标签信息性,采用词汇数据库和专业词汇表丰富情感标签表征;然后,采用强负采样技术,使每个文本与强负样本区分开;最后,利用结合情感标签信息的预测损失和结合强负采样的对比损失函数来保证模型的准确性。本发明集文本截断、情感标签信息增强、强负采样于一体,提高了分类预测的准确性。
本发明授权一种标签信息增强与强负样本驱动的分类预测方法在权利要求书中公布了:1.一种标签信息增强与强负样本驱动的分类预测方法,其特征在于,是按如下步骤进行: 步骤一、定义用户集U={u1,u2,…,ui,…,uI},其中,ui表示第i个用户,I为用户集U中的用户的数量; 定义文本集Set={S1,S2,…,Si,…,SI},其中,Si表示第i个用户ui的文本; 定义文本,其中,表示Si中的第j个语句,且,表示中的第m个词语,M表示中的词语数量;J为Si的语句数量; 定义习题集Q={q1,q2,…,qk,…,qK},其中,qk表示习题集Q中的第k个习题,且,表示qk中的第n个词语,N表示qk中的词语数量,K为习题集Q中习题的数量; 定义情感词汇表V={v1,v2,…,vq…,vQ},其中,vq为第q个情感词汇,Q为V中情感词汇的数量; 定义情感维度词集合Y={y1,y2,……,yp,……,yP},其中,yp为第p个情感维度词,P为情感维度词的数量; 令Si在情感维度词集合Y上的情感状态为Yi={y1 i,y2 i,……,yp i,……,yP i},其中,yp i为Si在第p个情感维度词yp上的情感状态,yp i∈{0,1}; 步骤二、构建基于标签信息增强与强负样本驱动的分类预测网络,包括:文本截断模块、标签信息增强模块、强负采样模块; 步骤2.1、所述文本截断模块对Si进行处理,得到ui的高质量文本; 步骤2.2、所述标签信息增强模块对情感维度词集合Y进行处理,得到情感语义信息嵌入; 步骤2.3、所述强负采样模块对Si进行强负采样处理,得到Si在情感状态yp i上强负样本集的注意力权重集; 步骤2.4、利用式9得到在第p个情感维度yp上的预测值: 9 式9中,W、b是非线性变换的2个参数,σ是sigmoid函数,是的表征; 步骤三、构建总损失函数,并对分类预测网络进行训练,得到最优分类预测模型; 步骤3.1、利用式10构建预测损失函数Lp: 10 步骤3.2、利用式11构建对比损失函数Lc: 11 式11中,是上中第μ个强负样本的表征; 步骤3.3、利用式12构建总损失函数L: 12 式14中,δ是超参数; 步骤3.4、利用梯度下降法对分类预测网络进行训练,并计算总损失函数L,以更新网络参数,直到总损失函数L收敛为止,从而得到训练后的最优分类预测模型,用于预测用户的情感标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经济技术开发区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励