Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广州市刑事科学技术研究所;厦门市美亚柏科信息股份有限公司陈诚获国家专利权

广州市刑事科学技术研究所;厦门市美亚柏科信息股份有限公司陈诚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广州市刑事科学技术研究所;厦门市美亚柏科信息股份有限公司申请的专利一种基于图卷积的短文本分类方法、装置、介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116049387B

龙图腾网通过国家知识产权局官网在2026-04-14发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111257904.9,技术领域涉及:G06F16/35;该发明授权一种基于图卷积的短文本分类方法、装置、介质是由陈诚;杜世东;赵伟;李文瑞;赵建强设计研发完成,并于2021-10-27向国家知识产权局提交的专利申请。

一种基于图卷积的短文本分类方法、装置、介质在说明书摘要公布了:本发明提出了一种基于图卷积的短文本分类方法、装置、设备及存储介质,该方法包括:对获取的训练样本中的多个短文本进行预处理后得到分词结果、句法分析结果和词性分析结果,基于上述结果构建多特征融合图的矩阵;使用图卷积神经网络基于所述多特征融合图的矩阵对多特征融合图的节点进行训练,得到训练后的单词节点特征向量;构建位置嵌入向量,后与单词节点特征向量进行拼接后对分类器模型进行训练得到训练后的分类器模型;对待分类的短文本进行分词处理后基于所述训练后的单词节点特征向量得到待分类的短文本的词向量,进行分类。本发明提出了融合词性、依存性、文档信息的文本多特征图表示方法,提升分类的准确率,克服了背景技术中的缺陷。

本发明授权一种基于图卷积的短文本分类方法、装置、介质在权利要求书中公布了:1.一种基于图卷积的短文本分类方法,其特征在于,该方法包括: 预处理步骤,对获取的训练样本中的多个短文本进行预处理及标注后使用StanfordCorenlp工具包进行处理,得到分词结果、句法分析结果和词性分析结果,其中,句法分析结果为句法成分解析树,词性分析结果只保留名词和形容词; 构建多特征融合图,所述多特征融合图中的总节点包括所有单词节点、所有短文本节点和两个词性节点、一个Root节点,其中,词性节点是名词和形容词、Root节点是句法成分分析树的根节点; 计算多特征融合图中的单词节点之间的PMI值: 其中, 这里N是短文本中滑动窗口总数,Nword1,word2是同时包含节点word1和word2的滑动窗口数,Nword是包含节点word的滑动窗口数; 计算多特征融合图中的单词节点与短文本节点之间的TF-IDF值: TF-IDFi,j=TFi×IDFi,j 其中Pi,j表示单词i在短文本j中出现的次数,Mj表示短文本j的总词数,N表示训练样本中的所有短文本数,Ni表示包含词i的短文本数; 根据句法成分分析树和词性分析结果构建邻接矩阵A,邻接矩阵上权重表示如下: 对邻接矩阵A进行规范化处理得到多特征融合图的矩阵 其中,D是多特征融合图的度矩阵; 节点向量训练步骤,使用两层图卷积的图卷积神经网络对多特征融合图的节点进行训练, 其中,X是为多特征融合图的节点的特征矩阵,X=[X1,X2,...,Xn],b0和b1是偏置向量,n是节点数,W0和W1是图卷积神经网络的初始权重矩阵,ReLu和Softmax是激活函数,其中 ReLux=maxx,0 设置损失函数、优化方法和学习率,对训练参数进行训练更新,训练完成后,得到训练后的单词节点特征向量X; 分类器训练步骤,构建位置嵌入向量O,O=[one-hot1,one-hot2,...,one-hotn]; 将位置嵌入向量与所述训练后的单词节点特征向量进行拼接得到X=[X1+O1,X2+O2,...,X3+On],将拼接后的向量X输入注意力模型; 对输入向量X进行非线性变换,得到Query,Key,Value,其中,Query=σQXWQ+bQ;Key=σKXWK+bK;Value=σVXWV+bV,Value是词嵌入X经过非线性变换后的向量,dk是向量Key的维度,W是权重矩阵,σQ,σK,σV是tanh激活函数,重复执行h次,即 计算多头注意力 Multi-HeadQ,K,V=Concathead1,...,headhW0; 其中, headi=Self-AttentionQueryi,Keyi,Valueii=1,...,h; 其中, 添加归一化层 其中,X是经过多头自注意力运算后的特征矩阵; 其中, 其中,X_i表示X的第i维,m表示X的均值,σ表示X的标准差,α、β是可学习的参数,E是为了防止除数为0而设置的小数,H是多头注意力中头的个数; 使用一个全连接层和softmax函数对输出结果Y进行分类预测: FFNy=ReLUyW1+e1W2+e2 其中,y是经过层归一化后的输出向量,e1、e2为偏置项;经过一层softmax激活函数后得到反映每个分类概率的输出向量; 设置损失函数、优化方法和学习率,对分类器模型参数进行训练得到训练好的分类器模型,并将分类器模型的参数进行保存; 分类步骤,对待分类的短文本进行分词处理后基于所述训练后的单词节点特征向量得到待分类的短文本的词向量,使用训练后的分类器模型对待分类的短文本的词向量进行分类。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州市刑事科学技术研究所;厦门市美亚柏科信息股份有限公司,其通讯地址为:510030 广东省广州市越秀区仓边路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。