合肥工业大学张琨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利基于文本敏感性和语义不变性的对比学习方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115221890B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210686197.3,技术领域涉及:G06F40/30;该发明授权基于文本敏感性和语义不变性的对比学习方法和系统是由张琨;吴乐;汪萌设计研发完成,并于2022-06-17向国家知识产权局提交的专利申请。
本基于文本敏感性和语义不变性的对比学习方法和系统在说明书摘要公布了:本发明提供一种基于文本敏感性和语义不变性的对比学习方法、系统、存储介质和电子设备,涉及对比学习技术领域。与现有方法相比,本发明一方面通过在表征层面进行数据增强,保证了输入句子的语义经过数据增强之后保持不变,从而更有效的支持对比学习进行特征不敏感性学习。另一方面本发明通过设计任务相关或者数据相关的敏感特征选择方法,使得模型在进行特征敏感学习过程中更具有针对性,提升了模型在下游任务上的适应能力,而且敏感特征选择方法与敏感特征学习过程解耦合,从而保证了模型可以根据具体需求设计不同的敏感特征选择方法,提升了模型的泛化能力和适用性。
本发明授权基于文本敏感性和语义不变性的对比学习方法和系统在权利要求书中公布了:1.一种基于文本敏感性和语义不变性的对比学习方法,其特征在于,包括: S1、在当前训练批次中确定锚点样本和负样本,采用预训练模型分别获取所述锚点样本、负样本的语义表示矩阵;在所述锚点样本的语义表示矩阵上进行数据增强,获取语义不变的特征不敏感增强表示,并作为正样本的语义表示; S2、根据所述锚点样本中每个词在整个训练集中的权重,以及所述锚点样本的语义表示矩阵,采用所述预训练模型获取数据相关的特征敏感增强表示; S3、分别获取所述锚点样本、负样本和正样本的语义表示矩阵,以及特征敏感增强表示对应的语义表示向量;将所述锚点样本、负样本和正样本的语义表示矩阵对应的语义表示向量映射到不同的度量空间,获取第一映射输出结果;将所述特征敏感增强表示对应的语义表示向量映射到最后的判定空间,获取第二映射输出结果; S4、根据所述第一映射输出结果,构建第一损失函数;根据所述第二映射输出结果,构建第二损失函数;融合所述第一损失函数和第二损失函数,获取最终的损失函数并用于优化参数直至模型收敛; 所述S1中:通过对语义表示矩阵Hi执行顺序打乱,遮盖掉部分特征列以及对整个矩阵表示中的元素进行随机丢弃操作,获取所述特征不敏感增强表示,该过程可以表示如下: op1=randomshuffling,featurecutoff,dropout, 其中,op1表示第一数据增强方式,shuffling表示顺序打乱操作,featurecutoff表示遮盖掉部分特征列操作,dropout表示随机丢弃操作;就表示经过数据增强之后的语义不变的特征不敏感增强表示; 所述S2包括: S21、采用TF-IDF方法统计分析训练集中所有句子,获取所述锚点样本中每个词在整个训练集中的权重αij,并与预设的权重阈值θ进行比较大小,若αij>θ,将该权重对应的词进行数据增强; S22、结合所述锚点样本的语义表示矩阵,通过WordNet在词的层面以一定的概率β,对上述步骤确定的需要数据增强的词进行数据增强,采用所述预训练模型获取数据相关的特征敏感增强表示,所述该过程可以表示如下: op2=randomSynonym,Delete,Swap,Noop 其中,op2表示第二数据增强方式,Synonym表示同义词替换操作,Delete表示随机删除操作,Swap表示随机交换操作,Noop表示不做任何操作; 其中,表示经过数据增强以后的第i个句子中的第l个词的one-hot表示;表示经过数据增强以后句子表示;表示数据相关的特征敏感增强表示;f表示预训练模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。