山东科技大学杨洪娟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东科技大学申请的专利一种基于双向长短期记忆模型与知识图谱的文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115391532B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211024484.4,技术领域涉及:G06F16/35;该发明授权一种基于双向长短期记忆模型与知识图谱的文本分类方法是由杨洪娟;田刚设计研发完成,并于2022-08-25向国家知识产权局提交的专利申请。
本一种基于双向长短期记忆模型与知识图谱的文本分类方法在说明书摘要公布了:本发明提供了一种基于双向长短期记忆模型与知识图谱检索相结合的文本分类方法,该方法通过使用注意力机制根据任务从知识图谱中检索相关的先验支持事实,并将其与从训练数据中学到的特征一起纳入特征空间对文本进行分类。它首先通过使用GloVe工具生成句子的词嵌入模型,然后分别放入知识图谱检索模块与双向长短期记忆网络BiLSTM中,后将检索模型的输出与BiLSTM模型的输出进行拼合得到最终分类。与传统方法相比,通过使用知识图谱的方法准确率有着明显的改善。最后在20Newsgroups文本分类数据集上评估我们的模型,实验结果证明了其有效性。
本发明授权一种基于双向长短期记忆模型与知识图谱的文本分类方法在权利要求书中公布了:1.一种基于双向长短期记忆模型与知识图谱检索相结合的文本分类方法,其特征在于,包括以下步骤: 步骤1:收集数据集文档,将标签定义为二十类,按照数据集中数据的分布将数据分为训练集与测试集; 步骤2:对训练组与测试组进行文本预处理:使用GloVe词嵌入工具将训练组与测试组中的内容训练成词嵌入模型,并将词嵌入向量放入双向长短期记忆神经网络BiLSTM得到特征向量; 步骤3:将步骤2中的词嵌入向量输入至知识图谱检索模块中,得到其输出特征向量,具体包括以下子步骤: 步骤3.1:使用Glove词嵌入工具处理每个句子的词嵌入,将该词嵌入作为BiLSTM的输入和知识图谱检索模块的输入; 步骤3.2:将得到的词嵌入送入BiLSTM模块中进行编码得到向量o,然后从向量o形成上下文向量C,其过程如式123所示: , 其中为当前输入,为上一个状态的传递,f为非线性函数; , 其中T为序列长度; , 其中W为权重参数,ReLU为激活函数; 步骤3.3:步骤3.2中使用分别的BiLSTM通过相同的过程形成两个不同的上下文向量,分别用于实体检索与关系检索; 步骤3.4:将知识图谱中的实体与关系生成空间注意力;对于实体向量注意力与关系向量注意力如公式45给出: , , 其中|E|为知识图谱中的实体个数,|R|为知识图谱中的关系个数; 步骤3.5:最终检索的实体和关系向量是通过加权总和与各个检索到的实体关系向量的注意力值来计算的,如式67所示: , , 步骤3.6:将步骤3.5中得到的实体向量e和关系向量r通过知识图谱嵌入技术DKRL形成知识图谱嵌入,作为步骤4中的输入t; 步骤4:将步骤2中的BiLSTM输出特征向量与步骤3中的知识图谱检索模块输出的特征向量使用一个多层感知器MLP拼接在一起,使用激活函数得到其最终分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东科技大学,其通讯地址为:266590 山东省青岛市经济技术开发区前湾港路579号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励