西北工业大学王柱获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种基于联合建模的多粒度情感分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116303897B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310211377.0,技术领域涉及:G06F16/334;该发明授权一种基于联合建模的多粒度情感分析方法是由王柱;王哲昊;赵师瑶;郭斌;於志文设计研发完成,并于2023-03-07向国家知识产权局提交的专利申请。
本一种基于联合建模的多粒度情感分析方法在说明书摘要公布了:本发明提供一种基于联合建模的多粒度情感分析方法,属于深度学习领域。该方法使用BERT作为公共编码层,为不同的情感分析提供文本嵌入表达。由于不同的方面类别信息分散在中评论R,为了动态聚合每个方面类别的相关词符的嵌入表达,模型增加了一个注意力池化层。注意力池化层可以帮助模型关注与目标方面类别相关性最高的词符。表示评论内容整体的[CLS]表达,被用作总体情感预测任务的预测层输入;面向方面的情感极性判断依赖于经过注意力池化层重新聚合的信息方面文本表达;而其构成的整体还会通过由先验专家知识构成的降维矩阵计算后,被用作用户画像任务。
本发明授权一种基于联合建模的多粒度情感分析方法在权利要求书中公布了:1.一种基于联合建模的多粒度情感分析方法,其特征在于,包括: 步骤1:加载带标注的互联网商业平台评论数据集,并对数据集进行处理; 步骤1-1:将数据集中的评论内容去除英文、标点符号,并进行繁简转换统一为简体中文; 步骤1-2:利用Jieba分词工具对评论文本进行分词; 步骤1-3:载入停用词词典,去除停用词; 步骤2:将处理过后的数据集输入BERT得到文本表示; 步骤2-1:载入BERT模型bert-base-Chinese,表示维度设置为预训练模型缺省值768; 步骤2-2:将分词结果句首添加,该符号用于总体并将该符号对应的输出向量作为整篇文本的语义表示,用于下游文本分类任务,也由该表示构成先验矩阵; 步骤2-3:将每个词的文本表示结果输入上下文表示层,设置表示向量的维度768,得到的文本表示为; 步骤3:将和针对不同的下游任务进行处理; 步骤3-1:文本表示层对所得的分词嵌入表达向量构成矩阵,其中,代表向量的维度,代表该句中词语的数量; 步骤4:将文本表达通过注意力池化层,为每个方面类别相关词符表达聚合上下文信息; 步骤4-1:注意力池化层的输入为表达矩阵,依赖注意力机制可以聚焦与目标方面类别相关性最高的词符,从而将文本表达转化为针对具体方面的表达; 步骤4-1-1:将表达输入带参注意力池化层,通过网络实现参数学习,并利用激活函数将结果映射到所需空间中,其过程如下公式所示: ; 其中,是通过激活函数映射过后的中间参数,是需要被训练网络学习的参数; 步骤4-1-2:计算注意力权重,将前步骤的中间参数输入softmax激活函数后可以得到每个词符的注意力权重,该步骤的目的是更加准确的关注与方面类别词语相关性高的部分,计算过程如下公式所示: ; 其中,是通过注意力权重,是训练参数; 步骤4-1-3:基于注意力权重,重新对上下文表示层得到的结果进行加权计算,通过激活函数可以得到经过关于信息聚合后某一方面的表示结果,计算过程如下公式所示: ; 其中,是与第个方面相关的评论文本表示,是门控函数,用于过滤掉没有提到第个方面的值; 步骤5:基于先验知识构造先验矩阵,再利用先验矩阵对方面类别相关的文本表示进行变换; 步骤5-1:对于用户画像任务的先验矩阵,将特殊场景下的画像类标签为评论的表示进行加和平均,对个标签重复此步骤,构造先验矩阵,其维度为;其中,画像在领域总共有6类标签,由专家知识确定,将被标注为的评论通过BERT得到其表示,对所有标注为的评论的表示进行平均计算,得到先验矩阵中的第一列,代表标签对于全维度的影响; 步骤5-2:将步骤4-1-3得到的所构成的矩阵与先验矩阵进行计算并通过双曲正切激活函数,得到: ; 步骤6:将计算得到的表达、、分别用作下游预测任务的输入,、、分别被输入到三个下游任务,即总体评价预测任务、多方面情感预测任务、基于二者的用户画像任务; 步骤6-1:对面向方面的情感预测任务提供输入,并得到所需的预测值: ; 其中,是需要的得到的预测值,和都是参数,是增强模型泛化能力的扰动; 步骤6-2:对特殊场景下先验知识参与计算的表示结果进行用户画像的预测: ; 其中,是预测参数,是增强泛化能力的扰动,是步骤5-2所得的全维度的文本表达; 步骤6-3:该任务的目标是利用步骤2-1中的进行总体情感分析预测,其过程如下所示: ; 其中,表示预测的总体评分,为模型训练学习参数,表示关于评论的参数,是关于评论偏差,这个分类任务依赖BERT额外的隐藏层,通过激活函数实现情感分类预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励