南京邮电大学徐竟晗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利一种基于深度学习的社会网络不实言论的智能检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117034070B 。
龙图腾网通过国家知识产权局官网在2026-03-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310538062.7,技术领域涉及:G06F18/24;该发明授权一种基于深度学习的社会网络不实言论的智能检测方法是由徐竟晗;徐小龙设计研发完成,并于2023-05-12向国家知识产权局提交的专利申请。
本一种基于深度学习的社会网络不实言论的智能检测方法在说明书摘要公布了:本发明公开了一种基于深度学习的社会网络不实言论的智能检测方法,包括,收集一个时间段的社交网络上的所有消息的文本信息,回复文本信息和拓扑信息并进行文本预处理操作;将消息的文本信息输入局部信息编码器,输出消息的文本信息特征向量;将消息构成的社交网络拓扑图拓扑信息输入全局信息编码器,输出消息的拓扑信息特征向量;将消息的文本信息特征向量和拓扑信息特征向量拼接在一起,得到融合特征向量;将融合特征向量输入线性网络,输出最终的预测向量。本发明在使用固定长度样本在保证训练效率的前提下,通过融合网络消息内容、其回复消息内容和消息在传播图中的拓扑信息,大大增强了模型特征提取能力,克服了模型特征提取能力不足的问题。
本发明授权一种基于深度学习的社会网络不实言论的智能检测方法在权利要求书中公布了:1.一种基于深度学习的社会网络不实言论的智能检测方法,其特征在于:包括: 收集一个时间段内的社交网络上的所有消息的文本信息、回复信息和拓扑信息并进行文本预处理操作; 所述文本预处理操作包括以下步骤: 遍历数据集的每一行,将不属于文本的符号去除,并进行文本格式化; 每遍历一行,将每一行中的ID、源消息内容、消息对应标签信息分别存入消息ID,源消息内容和所属标签三个存储列表中; 将消息ID作为索引,索引到源消息ID对应的所有回复消息,以列表的方式存储所有的回复消息文本,并将该消息列表存入源消息所属回复信息列表中; 将所有文本数据列表拼接在一起,形成一个句子列表; 创建一个空字典; 对所有出现的字符进行频次排序,将字符本身作为键,将排序后的序号作为值,将该键值对存入字典中; 遍历所有文本句子,将所有文字符号序列化; 限定消息的最大长度、单条消息的最大回复数和单条回复的最大长度; 逐一遍历所有的文本句子,将超过限制长度的序列部分进行截断,对不满限定长度的序列用全0扩充; 得到社交消息及其回复消息的序号序列; 将消息的文本信息输入局部信息编码器,输出消息的文本信息特征向量;将消息的回复信息输入局部信息编码器,输出消息的回复融合信息特征向量; 所述将消息的文本信息输入局部信息编码器,输出消息的文本信息特征向量包括以下步骤: 将消息及其回复的序号序列向量化,得到无时序的文本向量; 将不带有时序信息的文本向量输入到神经网络模型中,模型输出的序列中带有时序信息,其中任意序列仅与当前时间步输入的其余序列相关,而与其他步的全部序列无关; 当前每个消息样本都为形式的单精度浮点数二维向量,其中L为句子最大字符数,D为单个词向量的维度,通过对该向量进行不同大小卷积核的卷积,得到不同大小的一维向量结果; 取出各自向量中的最大值,拼接在一起,得到一个新的一维向量,作为当前步骤最终的消息文本表达一维向量; 将消息的文本信息特征向量与回复融合信息特征向量以不同权重拼接,得到消息局部信息特征向量;将所有消息构成的社交网络拓扑图拓扑信息输入全局信息编码器,得到拓扑信息特征向量; 将消息的文本信息特征向量和拓扑信息特征向量拼接在一起,得到融合特征向量; 所述将消息的文本信息特征向量与回复融合信息特征向量以不同权重拼接,得到消息局部信息特征向量包括以下步骤: 设置一个参数alpha,其表示原消息与回复二者之间在融合特征向量中所占的比重,比重和为1,该参数可以进行训练, 最终融合文本向量的表示可以表示为: 其中分别表示文本融合特征向量,原消息文本特征向量和回复消息文本特征向量; 所述将所有消息构成的社交网络拓扑图拓扑信息输入全局信息编码器,输出消息的拓扑信息特征向量包括如下步骤: 对回复消息进行相同的操作,得到回复消息的一维特征向量; 对基于回复消息文本得到的向量表达进行自注意力机制的转化,得到新回复消息特征向量; 将转化后的每一条回复消息向量前面拼接上对应的消息向量,经过线性网络和激活层,最终得到每条消息对于消息的权重; 计算每条消息的所有回复的权重和,最终得到与消息维度大小相同的融合回复消息向量; 将二者拼接在一起,得到最终的消息文本融合向量; 将预处理后的图数据输入到图注意力网络中,进行训练,图中的每一个节点即代表一条社交网络中一条发布消息; 模型最终输出每个节点的特征向量,用以表示该节点在拓扑结构方面的信息; 将融合特征向量输入线性网络,输出最终的预测向量; 预测向量中每个值为对各类标签的预测值,取预测值中最大值对应的标签作为最终预测的标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励