厦门快商通科技股份有限公司宋正博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉厦门快商通科技股份有限公司申请的专利一种小样本文本分类方法及模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114117039B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111312643.6,技术领域涉及:G06F16/35;该发明授权一种小样本文本分类方法及模型是由宋正博;肖龙源;李稀敏;李威设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。
本一种小样本文本分类方法及模型在说明书摘要公布了:本发明公开了一种小样本文本分类方法及模型,包括以下步骤:步骤a.对输入语料信息中的词汇进行词向量转换,得到词向量矩阵;步骤b.通过双向长短期记忆层处理词向量矩阵,得到词向量矩阵对应的隐层状态序列;并基于隐层状态序列提取自注意力特征向量e,得到自注意力特征向量矩阵E;步骤c.基于自注意力特征向量矩阵E,通过胶囊网络来表征类别向量c,得到所有已知类别的类别向量c;步骤d.基于所有已知类别的类别向量c对输入语料信息进行关系打分,得到与所述输入语料信息相似度最高的类别向量c,则该类别向量c对应的类别为输入语料信息的分类结果。本发明能够学习文本空间特征的归纳网络模型,对于文本语义的类表示进行更有效的归纳。
本发明授权一种小样本文本分类方法及模型在权利要求书中公布了:1.一种小样本文本分类方法,其特征在于,包括以下步骤: 步骤a.对输入语料信息中的词汇进行词向量转换,得到词向量矩阵; 步骤b.通过双向长短期记忆层处理所述词向量矩阵,得到所述词向量矩阵对应的隐层状态序列;并基于所述隐层状态序列提取自注意力特征向量e,得到自注意力特征向量矩阵E; 步骤c.基于所述自注意力特征向量矩阵E,通过胶囊网络来表征类别向量c,得到所有已知类别的类别向量c; 步骤d.基于所有已知类别的类别向量c对所述输入语料信息进行关系打分,所述关系打分指的是将所述输入语料信息与类别向量c进行相似度判断,得到与所述输入语料信息相似度最高的类别向量c,则该类别向量c对应的类别为所述输入语料信息的分类结果; 所述步骤c包括如下步骤: c1.将自注意力特征向量矩阵E进行一次线性映射得到映射注意力特征向量矩阵e’,再将映射注意力特征向量矩阵e’压缩成胶囊尺寸的单位向量; c2.初始化变量b=0,对变量b进行求和、归一化处理得到向量d,所述向量d为路由索引的权重; c3.将向量d与映射注意力特征向量矩阵e’进行点乘运算,并将运算结果再与映射注意力特征向量矩阵e’进行点乘运算得到变量b’; c4.用变量b’更新向量b,并重复步骤c1和c2,迭代m次,直到得到各个类别样本对类别归纳向量的映射; c5.对各个类别样本对类别归纳向量的映射进行归一化处理,得到对应类别的表示概率; 在所述步骤a之前还包括数据读取步骤: 将支持集和查询集的样本按C-wayK-shot的方式从原始语料信息中随机选择样本,构造训练集;并将支持集和查询集的样本分别按C-wayQ-shot的方式从原始语料信息中随机选择样本,构造验证集;其中,C表示类别数量,K表示训练集样本数量,Q表示验证集样本数量; 所述输入语料信息是对训练集进行数据处理后得到的; 所述数据处理包括以下步骤: 步骤一:对训练集内的训练样本进行预处理,并构建字表,所述字表为所述训练样本中包含的所有汉字所组成的列表;基于所述字表对所述训练样本中的每个字进行数字化,得到数字化训练样本; 步骤二:对数字化训练样本的句子文本进行文本意图分类,得到每个句子文本的所属意图类别,分批读取句子文本以及其对应的所属类别;并将所述句子文本进行分词得到标注标签; 步骤三:将所述标注标签与句子文本长度、文本掩码进行拼接,形成所述输入语料信息; 所述步骤b包括如下步骤: b1.通过双向长短期记忆层处理所述词向量矩阵,得到所述词向量矩阵对应的隐层状态序列Q1; b2.将隐层状态序列Q1与K1进行点乘运算,得到词向量矩阵的相关性,其中,K1表示第一权重序列向量; b3.对所述相关性进行求和并取平均值,得到自注意力特征向量矩阵E。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门快商通科技股份有限公司,其通讯地址为:361009 福建省厦门市集美区软件园三期诚毅北大街63号1301单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。