淮阴工学院陈晓兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉淮阴工学院申请的专利基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114510569B 。
龙图腾网通过国家知识产权局官网在2025-06-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210030824.8,技术领域涉及:G06F16/353;该发明授权基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法是由陈晓兵;康丽;卢佳琪;包涵;张润;张冰莹设计研发完成,并于2022-01-12向国家知识产权局提交的专利申请。
本基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法在说明书摘要公布了:本发明公开了一种基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法,首先对文本数据进行文本预处理;然后,对词语进行注意力机制处理,提取单词和子序列的信息依赖关系;与此同时,基于改进ChineseBERT预训练模型进行拼音信息和字符信息的提取;之后对拼音信息和字符信息进行矩阵融合,同时加上位置信息,保持上下文语义的完整性,通过经典的Bert模型进行处理,使用参数共享机制,得到最终的信息特征向量;对得到的上下文语义向量和信息依赖关系向量融合,作为CNN的输入,得到最终的化工新闻分类结果。本发明充分优化了文本的拼音字符语义信息;提取词语的依赖关系和局部依赖关系的问题;通过Bert模型参数共享机制降低时间复杂度的问题,有效的提高文本分类的精确度。
本发明授权基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法在权利要求书中公布了:1.一种基于ChineseBERT模型和注意力机制的化工突发事件新闻分类方法,其特征在于,包括以下步骤: 1将化工突发事件新闻文本数据集D进行文本预处理,得到预处理后的新闻文本数据集D1; 2通过word2vec模型处理D1,得到词特征向量R1,将词特征向量R1输入到WordAttention模型中,得到新的词依赖特征向量H1,再将词依赖特征向量H1输入到SeqAttention模型,得到子序列特征向量H2; 3通过对D1进行开源拼音包处理,得到对应的拼音序列,之后输入到MLP,经过最大池化层输出拼音向量H3,对预处理后的文本进行one-hot编码,得到字符向量H4,与拼音向量H3进行矩阵化嵌入,得到融合特征向量R3; 4将融合特征向量R3与位置特征向量R4进行整合得到特征向量H5,输入H5至Bert预训练模型中,得到预训练后的语义特征向量H6; 5将步骤2中的子序列特征向量H2与步骤4中的语义特征向量H6进行整合,输入到CNN模型中,得到最终的文本分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人淮阴工学院,其通讯地址为:223100 江苏省淮安市洪泽区东七街三号高新技术产业园A12-2(淮阴工学院技术转移中心洪泽分中心);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。