Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 复旦大学李聪获国家专利权

复旦大学李聪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉复旦大学申请的专利基于用户语义、属性和邻域信息的社交机器人检测算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115309813B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210940789.3,技术领域涉及:G06F16/26;该发明授权基于用户语义、属性和邻域信息的社交机器人检测算法是由李聪;陈诺;李翔设计研发完成,并于2022-08-07向国家知识产权局提交的专利申请。

基于用户语义、属性和邻域信息的社交机器人检测算法在说明书摘要公布了:本发明属于大数据挖掘技术领域,具体为基于用户语义、属性和邻域信息的社交机器人检测算法。本发明算法包括:通过BERT模型对文本内容进行编码,建模用户的语义表示,并联合用户属性和邻域特征,以用户为节点,转发关系为连边构建用户关系网络。将构建好的图数据使用改进的图注意力网络模型进行自监督训练来学习社交用户表示。模型通过子图采样的方式来进行并行化计算,并使用多任务学习设置辅助任务。为了解决数据不平衡问题,采用条件对抗生成网络进行数据增广,对最终得到的用户向量表示进行基于密度的聚类,得到是否是社交机器人的鉴别结果。本发明算法采用自监督技术并引入对抗性思路,可推广性强,迎合未来技术发展趋势。

本发明授权基于用户语义、属性和邻域信息的社交机器人检测算法在权利要求书中公布了:1.一种基于用户语义、属性和邻域信息的社交机器人检测算法,其特征在于,包括:对待鉴别的社交账户数据集进行数据预处理;采用BERT模型对账户文本特征进行编码得到文本特征向量;并对用户邻域特征和属性特征进行编码嵌入;最后通过联合编码来构建一个完整地社交用户表示向量;其中,采用条件生成对抗网络来进行数据增广,以解决原数据集中样本不平衡问题:将用户表示向量进行密度峰值聚类并去除噪音和较小的用户集,以聚类序列标记并作为每个节点用户的标签,将标签用户表示向量输入到改进的条件对抗生成网络模型;经过训练生成的样本与原始数据合并得到增广后的数据;将增广后的数据作为节点的初始隐藏向量输入一个改进的图注意力网络中,通过子图采样的方式来进行并行化计算,利用基于pagerank算法的图亲密度矩阵计算节点亲密度并选取邻居节点;模型采用多任务学习方式构建辅助任务来进行自监督训练,对最终训练好的判别模型输出进行HDBSCAN聚类,得到是否是社交机器人的鉴别结果;具体步骤为: 步骤1:对待鉴别的社交账户信息进行数据预处理;其中,所述社交账户信息包括用户文本、属性信息和邻域信息;文本信息来源于账户近期发布的推文;属性信息则来自公开的社交账户基本信息;邻域信息包含目标账户与其他账户的交互关系,包括转发、评论、关注行为,预处理过程包括: 1文本数据预处理,将文本切分为语义单元,方便于下游任务的处理; 2属性数据预处理,对原数据可能存在的缺失值、异常点问题进行数据处理来改善数据质量、提升分析可靠性; 3邻域数据预处理,对账户之间的关系进行建模得到关系图网络,并对网络中的异常节点进行删除或补齐,以方便后续对用户领域信息的进一步分析; 步骤2:对步骤1中预处理好的数据进行嵌入并聚合,以得到一个完整地用户向量表示;具体包括: 1将预处理好的文本数据输入到预训练的RoBERTa模型,得到用户语义特征向量; 2对预处理好的属性数据进行编码得到用户语义特征向量; 3对处理好的邻域数据进行编码得到用户邻域特征向量; 4对用户语义特征向量、用户属性特征向量和用户邻域特征向量进行聚合,得到最终的用户表示向量; 步骤3:将步骤2得到的用户表示向量进行密度峰值聚类,去除噪音和较小的用户集后,以聚类序列标记并作为标签分配给每个节点用户;具体地,将标签用户表示向量输入到一个条件生成对抗网络模型中,该模型通过引入Wasserstein距离,并以梯度惩罚来提高条件生成对抗网络收敛判断条件;经过多轮训练后,将生成的样本与原始数据合并得到增广后的数据,以此来解决原数据分布不平衡问题; 步骤4:对步骤3得到的增广后数据构建输入图并输入到图嵌入模型中进行训练;采用的图嵌入模型是以Graph-bert模型为基础的优化模型;在模型的预训练过程中引入与下游社交机器人检测任务相关的辅助信号,采用多任务学习方式来进行自监督训练;对最终训练好的模型的输出进行HDBSCAN聚类,根据聚类结果来判别是否是社交机器人。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。