东南大学;南京东南大学城市规划设计研究院有限公司段进获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学;南京东南大学城市规划设计研究院有限公司申请的专利一种基于社交媒体文本数据的空间基因识别提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116414985B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310396213.X,技术领域涉及:G06F16/353;该发明授权一种基于社交媒体文本数据的空间基因识别提取方法是由段进;李伊格;郭楚怡设计研发完成,并于2023-04-14向国家知识产权局提交的专利申请。
本一种基于社交媒体文本数据的空间基因识别提取方法在说明书摘要公布了:本发明公开了一种基于社交媒体文本数据的空间基因识别提取方法,包括以下步骤:采集关于城市的网络文本数据,然后对数据进行预处理,得到数据集D1;在分析软件中构建词典及向量空间,引入LDA主题模型,对得到的数据集D1进行主题分类;在各主题中合并同义词,并在数据集D1中进行同义词替换,得到数据集D2;在数据集D2中统计关键词两两共现次数,并构建共词矩阵M;利用层次聚类模型,对语义网络分析结果进行聚类,得到空间组合模式,即空间基因。本发明方法从多源社交媒体平台上采集关于某研究城市的网络文本数据,通过获取样本量丰富、非介入式的数据,为城市研究者识别城市空间基因提供了一种实用的技术手段。
本发明授权一种基于社交媒体文本数据的空间基因识别提取方法在权利要求书中公布了:1.一种基于社交媒体文本数据的空间基因识别提取方法,其特征在于,包括以下步骤: 步骤1、采集关于城市的网络文本数据,然后对数据进行预处理,得到数据集D1; 步骤2、在分析软件中构建词典及向量空间,引入LDA主题模型,对得到的数据集D1进行主题分类,得到k类主题,记为Z1、Z2……Zk,从其中选取与空间要素相关的主题,并将上述主题中包含的词语作为关键词,分别记为关键词集C1、C2……Cn,其中k≥n; 步骤3、在关键词集C1、C2……Cn和数据集D1中,同步进行同义词替换,将替换后的关键词集合记为关键词集C’,其包含的关键词记为a1、a2……ap,得到数据集记为D2; 步骤4、在数据集D2中统计关键词a1、a2……ap两两共现次数,并构建共词矩阵M; 步骤5、利用层次聚类模型,对语义网络分析结果进行聚类,得到空间组合模式,即空间基因; 所述步骤4中共词矩阵构建过程包括: 将数据集D2中每个文本构建二维数组formated_data; 将关键词集C’记为word_data; 建立一个二维矩阵matrix,其大小为:关键词词数+1×关键词词数+1即,共词矩阵,并将所有关键词作为共现矩阵的首行和首列; 设置矩阵对角线为0; 遍历formated_data,让取出的行关键词和取出的列关键词进行组合,一组关键词共现则在对应矩阵中+1,最终得到共词矩阵M; 所述步骤5中得到空间基因的过程包括: 将关键词向量化,每个词向量之间的距离Lx,y,如下式: Lx,y=x[1]-y[1]2+x[1]-y[2]2+…+x[n]-y[n]24 构建n个类,每个类只包含一个关键词; 计算每两个聚类之间的距离,将距离最近的或最相似的两个聚类进行合并,构建一个新类; 重复上述步骤,直至得到合适类别的聚类结果,每一组聚类结果便是一组稳定存在、具有地方代表性并形成广泛共识的空间组合模式,即为空间基因。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学;南京东南大学城市规划设计研究院有限公司,其通讯地址为:210096 江苏省南京市玄武区新街口街道四牌楼2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励