三峡大学但志平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉三峡大学申请的专利一种融合多维情感特征的中文仇恨言论检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119903224B 。
龙图腾网通过国家知识产权局官网在2025-10-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411811817.7,技术领域涉及:G06F16/906;该发明授权一种融合多维情感特征的中文仇恨言论检测方法是由但志平;李琳;鲁雨洁;李碧涛设计研发完成,并于2024-12-10向国家知识产权局提交的专利申请。
本一种融合多维情感特征的中文仇恨言论检测方法在说明书摘要公布了:本发明公开了一种融合多维情感特征的中文仇恨言论检测方法,包括S1,进行社交媒体数据集的整理与构建;S2,对步骤S1的数据集进行数据预处理,获得仇恨言论检测模型的输入数据;S3,进行仇恨言论检测模型的搭建、训练以及验证;仇恨言论检测模型的网络结构包括文本编码层、情感特征层、BiLSTM层以及分类层;S4,使用仇恨言论检测模型对社交媒体中的评论进行测试与识别;该方法通过将BiLSTM的输出与RoBERTa句子特征融合,增强模型对局部与全局信息的理解能力。同时为了解决数据类别不均衡问题,模型采用焦点损失函数进行优化,通过减少易分类样本的权重来增加难分类样本的关注度,进而提高模型的鲁棒性。
本发明授权一种融合多维情感特征的中文仇恨言论检测方法在权利要求书中公布了:1.一种融合多维情感特征的中文仇恨言论检测方法,其特征在于,包括以下步骤: S1,进行社交媒体数据集的整理与构建; S2,对步骤S1的数据集进行数据预处理,获得仇恨言论检测模型的输入数据; S3,进行仇恨言论检测模型的搭建、训练以及验证;仇恨言论检测模型的网络结构包括文本编码层、情感特征层、BiLSTM层以及分类层;仇恨言论检测模型的训练包括: S301,提取仇恨言论的文本特征: 对于给定的句子S=,表示文本序列的第i个词,n表示文本序列包含的词数; 通过n-gram和侮辱词典来判断是否为侮辱词,如果是,则进一步划分其攻击的目标群体; 将毒性嵌入与词嵌入相加获得词嵌入的增强表示,的增强表示为; 结合文本的段嵌入和位置嵌入,通过RoBERTa中的Transformer模块训练得到相应的词向量矩阵V; 取RoBERTa的Pooler层输出作为整个句子的特征表示; S302,提取仇恨言论的情感特征: 对于给定的句子S=,表示文本序列的第i个词,n表示文本序列包含的词数,汇总所有情感中每个单词和整个文本的分数来获得丰富的表示; 根据情感词典在计算其词级分数s,e,结合情感词典中情感强度和情感极性得分对词级得分进行加权并求和,分别得到情感词汇、情感强度、情感极性; 利用情感词典对文本中的标点符号、表情符号、情绪词、程度词、否定词、人称代词以及主张词的使用频率进行统计得到其他辅助特征,将四类特征进行拼接获得文本的情感特征; S303,获取深层上下文依赖特征: 将RoBERTa输出的词向量矩阵V与情感特征进行拼接得到向量,然后将输入到BiLSTM中,通过在两个不同方向的长短期记忆网络进行计算,最后将两个不同方向的计算结果进行合并输出,对每一时刻的输出进行保存,并将结果连接得到H; 得到BiLSTM层模块的输出向量后,将其与句子特征进行拼接,然后使用MLP层组合特征并将输出向量映射到样本标记空间,使用SoftMax进行归一化处理,计算得到每个标签的近似概率值y; S4,使用仇恨言论检测模型对社交媒体中的评论进行测试与识别,包括: S401,在公开数据集上,与现有的中文仇恨言论检测模型进行对比实验; S402,对仇恨言论检测模型进行消融实验; S403,对仇恨言论检测模型进行参数分析。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人三峡大学,其通讯地址为:443002 湖北省宜昌市大学路8号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励