浪潮云信息技术股份公司何彬彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮云信息技术股份公司申请的专利基于标签依赖度量的多标签分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115203410B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210739375.4,技术领域涉及:G06F16/35;该发明授权基于标签依赖度量的多标签分类方法及系统是由何彬彬;伊文超;朱利霞;李明明;潘心冰设计研发完成,并于2022-06-28向国家知识产权局提交的专利申请。
本基于标签依赖度量的多标签分类方法及系统在说明书摘要公布了:本发明公开了基于标签依赖度量的多标签分类方法及系统,属于自然语言处理技术领域,本发明要解决的技术问题为针对多标签间关系分类困难,难以收敛,采用的技术方案为:S1、对给定文本进行处理;S2、定义多标签之间的相关关系矩阵C;S3、将文本张量T依次输入到Embedding嵌入层和核心层后,得到文本嵌入向量;S4、利用分类标签集合D中类别数量,初始化标签嵌入;S5、利用多标签相关系数矩阵C蕴含的标签信息,计算文本嵌入与标签嵌入的內积注意力,从而将关系矩阵信息融入进文本嵌入向量X,进行重新表示;S6、将步骤S5中的重新表示后的文本嵌入向量输入到Maxpooling层和线性分类层中,计算出前向交叉熵损失,利用随机梯度下降算法进行全部参数的梯度更新。
本发明授权基于标签依赖度量的多标签分类方法及系统在权利要求书中公布了:1.一种基于标签依赖度量的多标签分类方法,其特征在于,该方法具体如下: S1、对给定文本进行处理:设定文本中最大字符长度为L,不足的部分进行“padding”补全;并利用字典索引对应表,生成文本张量T,文本张量T维度为;其中,R表示实数空间,L为正整数; S2、定义多标签之间的相关关系矩阵,同时定义分类标签集合为,共个类别;并设定当前文本所属的分类标签集合为,为集合的子集;其中,表示第个类别,,且与为正整数; S3、将文本张量T依次输入到Embedding嵌入层和核心层后,得到文本嵌入向量X,文本嵌入向量X维度为;其中,表示嵌入的维度,且为正整数; S4、利用分类标签集合中类别数量,初始化标签嵌入Y,标签嵌入Y维度为; S5、利用多标签相关系数矩阵蕴含的标签信息,计算文本嵌入与标签嵌入的內积注意力,从而将关系矩阵信息融入进文本嵌入向量X,进行重新表示; S6、将步骤S5中的重新表示后的文本嵌入向量输入到Maxpooling层和线性分类层中,计算出前向交叉熵损失,利用随机梯度下降算法进行全部参数的梯度更新; S7、对于集合中每一个分类标签嵌入,遍历多标签相关关系矩阵,计算出两两间的标签依赖度量损失函数;并对涉及到的分类标签嵌入进行二次参数更新,其余参数不参与更新; S8.在训练阶段,输入文本与分类标签,分别计算出交叉熵损失与标签依赖度量损失,按照步骤S6与步骤S7进行参数的多次更新迭代; S9、在预测阶段,输入文本,输出文本的多分类标签预测结果; 其中,多标签之间的相关关系矩阵具体如下: ; 其中,与具有相关关系的情形包括线性相关关系及包含关系;其他情形包括与具有排斥关系及无关系;,,为分类标签集合,,; 所述核心层为文本句子表征处理层,核心层采用LSTM、Bert或Roberta网络结构; 利用多标签相关系数矩阵蕴含的标签信息,计算文本嵌入与标签嵌入的內积注意力,从而将关系矩阵信息融入进文本嵌入向量X,进行重新表示具体如下: S501、计算文本嵌入向量X与标签嵌入Y的內积:; 其中,;;;; S502、计算注意力机制中的权重分配系数,公式如下: ; 其中,为多标签相关系数矩阵;的维度为,softmax函数在嵌入维度进行归一化操作; S503、利用权重分配系数的集成作用,将文本嵌入向量X重新表示为,的维度为,公式如下: 。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮云信息技术股份公司,其通讯地址为:250100 山东省济南市高新区浪潮路1036号浪潮科技园S01号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励