Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中通服咨询设计研究院有限公司王昕岩获国家专利权

中通服咨询设计研究院有限公司王昕岩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中通服咨询设计研究院有限公司申请的专利一种基于内容及特征差异性的谣言检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114036259B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111313004.1,技术领域涉及:G06F16/334;该发明授权一种基于内容及特征差异性的谣言检测方法及系统是由王昕岩;陈乔;魏康;顾耀;曹成钱;丁悦设计研发完成,并于2021-11-08向国家知识产权局提交的专利申请。

一种基于内容及特征差异性的谣言检测方法及系统在说明书摘要公布了:本发明提供了一种基于内容及特征差异性的谣言检测方法及系统,所述系统包括:事件信息获取模块,用于获取社交媒体平台的相关事件信息;事件预处理模块,用于分别获取事件的原文句向量以及评论句向量;事件检测模块,通过事件原文、评论处理模型,分别得到事件的原文、评论表征特征,再通过特征拼接得到事件表征特征,最后得到模型对事件的预测分类。本发明充分考虑了不同类信息在内容、结构上的差异性,相比于现有的技术方法,能够大幅提升谣言检测的准确率、精确率、召回率以及F1值。

本发明授权一种基于内容及特征差异性的谣言检测方法及系统在权利要求书中公布了:1.一种基于内容及特征差异性的谣言检测方法,其特征在于,包括以下步骤: 步骤1:通过爬虫技术,获取社交媒体平台的事件信息,构建事件数据集E={e1,e2,e3,…,eN},eN表示第N个事件,N取值为自然数; 步骤2:将获取的事件的文本信息,按照类别分为原文文本信息和评论文本信息,通过预处理方法分别得到事件的原文句向量和评论句向量; 步骤3:对于事件的原文句向量,通过事件原文处理模型,得到事件原文表征特征; 步骤4:对于事件的评论句向量,通过事件评论处理模型,得到事件评论表征特征; 步骤5:将步骤3得到的事件原文表征特征和步骤4得到的事件评论表征特征,通过事件分类输出模型得到对事件的预测分类,来判断事件是否为谣言; 步骤2包括:将谣言检测任务定义为:第i个事件ei的文本信息按照类别分为原文文本信息和评论文本信息,表示为ei={m0i,m1i,m2i,m3i,…,mMi},其中m0i为ei的原文文本信息,{m1i,m2i,m3i,…,mMi}为ei的评论文本信息,M为ei的评论文本信息数量,mMi表示ei的第M个评论文本信息,i取值为[1,N]; 步骤2还包括:对于事件ei的所有文本信息,先进行预处理,包括数据清理、数据增强以及向量化处理三个部分,在数据清理部分,通过正则化表达式去除文本数据中的网址、数字、@转发信息;在数据增强部分,对数据集中的原文文本数据,以及部分事件评论数过少的文本数据进行增强;在向量化处理部分,通过BERT预训练模型将事件ei的文本信息{m0i,m1i,m2i,m3i,…,mMi},分别转化为维数固定为768的句向量{v0i,v1i,v2i,v3i,…,vMi},v0i表示事件原文句向量,{v1i,v2i,v3i,…,vMi}表示事件评论句向量,vMi表示ei的第M个评论句向量; 步骤3包括:对文本卷积神经网络模型的卷积层进行改进,将卷积核的长度设置为与句向量等长的768,并将宽度固定为1来保证事件句向量的结构特征完整性;根据事件原文句向量v0i和数据增强后增加的句向量构建输入矩阵I0,首先通过卷积层,使用改进后的卷积核进行卷积计算,得到卷积层输出的特征列向量,再以竖直方向进行拼接后得到卷积层输出的特征列向量矩阵T0i: T0i=fW0×I0+b0其中W0为权重矩阵,b0为偏置量,f为Relu激活函数; 然后通过池化层,使用最大池化方法,对特征列向量矩阵的每一列保留数值最大的特征,得到事件ei的原文表征特征p0i; 步骤4包括:根据事件ei的评论句向量{v1i,v2i,v3i,…,vMi}构建输入矩阵I1,通过评论特征序列构建层,得到事件评论特征序列{s1i,s2i,s3i,…,sMi},sMi表示ei的第M个评论特征序列; 所述评论特征序列构建层具体表现为:将事件ei的评论句向量{v1i,v2i,v3i,…,vMi},首先通过卷积层,使用改进后的卷积核进行卷积计算,得到卷积层输出的特征列向量,再以竖直方向进行拼接后得到特征列向量矩阵T1i: T1i=fW1×I1+b1其中W1为权重矩阵,b1为偏置量; 最后对特征列向量矩阵T1i以水平方向进行拆分,得到事件评论特征序列{s1i,s2i,s3i,…,sMi}; 接着通过双向门控循环单元将事件ei的评论特征序列{s1i,s2i,s3i,…,sMi}在前向以及后向两个方向进行学习,分别得到前向隐藏层特征{hf1,i,hf2,i,hf3,i,…,hfM,i}以及后向隐藏层特征{hb1,i,hb2,i,hb3,i,…,hbM,i},接着将每个事件评论特征序列对应的两个隐藏层特征拼接后得到双向门控循环单元的输出特征{h1i,h2i,h3i,…,hMi},最后通过注意力层对输出特征进行注意力权重分配,得到事件ei的评论表征特征p1i: hij=hfj,i,hbj,i,j∈[1,M]uij=tanhWahij+bap1i=∑aij·hij其中,表示为前向门控循环单元对输入特征sij的训练;表示为后向门控循环单元对输入特征sij的训练; sij表示ei的第j个评论特征序列; hfj,i表示第i个事件、第j个评论信息在前向门控循环单元的隐藏特征; hbj,i表示第i个事件、第j个评论信息在后向门控循环单元的隐藏特征; hij表示第i个事件、第j个评论信息的双向门控循环单元输出特征; uij表示hij的注意力层隐藏特征,Wa为权重矩阵,ba为偏置量,tanh为激活函数; aij表示uij的注意力权重值,其中uw为权值矩阵; p1i表示第i个事件评论表征特征; 步骤5包括:将事件ei的原文表征特征p0i和评论表征特征p1i进行特征拼接,得到事件ei的表征特征pi,通过全连接层将表征特征与分类类别L={R,N}进行全连接,其中R表示谣言,N表示非谣言,分别得到对于事件在谣言类别以及非谣言类别的评估值,最后通过softmax函数,得到对事件分类的预测值,选取预测值中最大的类别作为事件的分类,完成谣言检测任务: pi=p0i,p1i。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中通服咨询设计研究院有限公司,其通讯地址为:210019 江苏省南京市建邺区楠溪江东街58号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。