昆明理工大学线岩团获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种基于双层结构熵图聚类的社交事件脉络生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119441632B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411437841.9,技术领域涉及:G06F16/9536;该发明授权一种基于双层结构熵图聚类的社交事件脉络生成方法是由线岩团;彭凡;王红斌;相艳;黄于欣设计研发完成,并于2024-10-15向国家知识产权局提交的专利申请。
本一种基于双层结构熵图聚类的社交事件脉络生成方法在说明书摘要公布了:本发明公开了一种基于双层结构熵图聚类的社交事件脉络生成方法,采用双层的、基于结构熵的聚类方法,通过粗粒度聚类进行主题聚类,细粒度的事件聚类来形成事件节点,并使用大模型来生成事件节点的摘要;并且构图不仅考虑关键词共现频率,还通过SentenceBert计算相似度考虑到语义,并且考虑消息之间的时间跨度对边删减,能构造一个好的社交消息图,进而提升图聚类效果,更好的进行社交事件时间线脉络分析。
本发明授权一种基于双层结构熵图聚类的社交事件脉络生成方法在权利要求书中公布了:1.一种基于双层结构熵图聚类的社交事件脉络生成方法,其特征在于,包括以下步骤: S1、对社交媒体数据进行预处理; S2、对每一条待处理的消息应用KeyBERT模型,进行关键词的提取; S3、对关键词构图并采用基于结构熵的聚类算法进行粗粒度的主题聚类;具体的为:当两个关键词同时出现在同一条消息中时,遍历各条消息的关键词,计算各个关键词对的共现频率;并把S2中去重后的关键词作为节点构建关键词共现图,将共现频率大于阈值的节点之间构建一条边;构图完成后,对图应用基于结构熵的社区检测算法,进行粗粒度的主题聚类; S4、基于S3的结果对于社交媒体的消息进行社区选择; S5、对消息进行构图并且基于S4的结果在每个社区下构图进行细粒度的事件聚类;具体的为: S5.1:把每一条消息视为一个节点,构建消息图;首先通过关键词频率构建,基于S2中每一条消息抽取的关键词,当两条消息中的关键词相同的个数大于等于2,则为两个节点构建一条边; S5.2:然后使用SentenceBert计算消息两两之间的相似度,若两条消息的相似度小于0.3且两条消息存在一条边,则删除存在的这条边;若相似度大于0.7并且这两条消息不存在边,则增加一条边若相似度介于0.3和0.7之间,则不做更改; S5.3:基于S4社区匹配后,根据每一个社区内部的消息提取子图,并且在社区内部应用基于结构熵的事件检测算法; S6、提取事件发生时间,并通过大模型对事件的多个消息进行多文档摘要的生成; S7、对各个事件通过时间进行排序生成事件时间线脉络,也即将S6中生成的摘要和内容按时间排序输出结果; S6.1:基于S5中,在社区内部把消息分成的多个簇,每一个簇的消息代表一个事件,每一个消息对应其发布时间或时间戳,将其统一转换为时间戳,把每个簇的消息的时间戳加和求均值,再转换为时间,精确到年月日,作为事件的发生时间; S6.2:对于生成每一个簇的摘要,使用大模型生成,把簇内度最大的k个节点的消息内容拼接在一起,每条消息之间使用“||”分割,再根据大模型支持最大输入token数截断拼接内容,并构建一个有效的提示词。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励