杭州电子科技大学上虞科学与工程研究院有限公司周志光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州电子科技大学上虞科学与工程研究院有限公司申请的专利情感特征一致性驱动的地理空间点数据采样方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117312468B 。
龙图腾网通过国家知识产权局官网在2025-08-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311110709.2,技术领域涉及:G06F16/29;该发明授权情感特征一致性驱动的地理空间点数据采样方法是由周志光;张欣隆;杨振东;邬臻林;吕中嵩;卫博红;刘玉华设计研发完成,并于2023-08-30向国家知识产权局提交的专利申请。
本情感特征一致性驱动的地理空间点数据采样方法在说明书摘要公布了:本发明公开了情感特征一致性驱动的地理空间点数据采样方法。本发明方法首先对社交媒体数据集使用情感分析模型VADER进行情感分析,得到文本信息所表达的情感值;然后对所有数据项使用凝聚分层方法进行聚类,提取局部区域的情感分布,首先进行预聚类,得到预簇,然后自底向上聚类,得到聚类树;对所有预簇的数据项进行采样,保持全局情感分布和局部情感分布;采用回溯平均贡献值最低的采样节点方法,尽可能地保留全局情感分布和空间分布。本发明根据情感属性和数据项的地理位置提取多尺度区域中的情感分布,帮助用户对大规模带有地理标签的社交媒体数据进行地理空间情感分析,在简化和探索大社交媒体数据方面的具有有效性和实用性。
本发明授权情感特征一致性驱动的地理空间点数据采样方法在权利要求书中公布了:1.情感特征一致性驱动的地理空间点数据采样方法,其特征在于: 步骤1获取开源的社交媒体数据集;社交媒体数据集中每个数据项的属性包括文本信息、用户ID、时间、地理坐标; 步骤2对社交媒体数据集的文本信息进行词干提取后,使用情感分析模型VADER进行情感分析,得到文本信息所表达的情感值; 步骤3对所有数据项使用凝聚分层方法进行聚类,提取局部区域的情感分布; 凝聚分层方法首先进行预聚类,得到预簇,然后自底向上聚类,得到聚类树; 在预聚类阶段,根据核密度和情感值对数据项进行合理聚类,具体方法是: 随机选择一个数据项,计算其泊松盘半径,其中为基于地理坐标的核密度估计计算结果,为设定参数;以数据项地理坐标为圆心,为半径范围内的数据项作为一个初始预簇; 对初始预簇内的数据项根据情感值进行筛选,得到预簇; 对于初始预簇内的数据项的情感值,如,则数据项与数据项归属为一个预簇,为设定的情感值阈值; 重复上述过程,直到所有的数据项都归属于不同的预簇,且每个数据项仅归属于一个预簇,得到个预簇; 在自底向上聚类阶段,首先根据地理坐标计算两个预簇之间的相似性:预簇与预簇平均相似度,,;其中和分别为预簇和预簇所包含数据项的数量,和分别数据项和数据项的地理坐标,表示2范数;如果平均相似度大于等于设定相似性阈值则将两个预簇归属为一个一级节点,如果一个预簇与其他任何预簇的平均相似度都小于相似性阈值,则该预簇本身作为一级节点;采用相同方法,对一级节点继续进行向上聚类,得到二级节点,以此类推,得到一个根节点; 提取各级节点以及根节点所包含预簇的情感分布:计算每个预簇内所有数据项的平均情感值,,得到各级节点以及根节点的情感分布向量,向量中每个维度的元素即为其对应预簇的平均情感值; 步骤4对所有预簇的数据项进行采样,以保持全局情感分布和局部情感分布; 首先从每个预簇任意选择一个数据项作为初始样本,进行第一轮采样,得到每个初始样本的情感值的置信区间; 如果一个或多个预簇的置信区间与其他所有预簇的置信区间都不重叠,则停止对这些预簇进行后续采样,将初始样本作为这些预簇的采样样本,并对剩余预簇进行第二轮采样,如果一个或多个预簇的置信区间与其他所有预簇的置信区间都不重叠,则停止对这些预簇进行后续采样,将初始样本和新增样本作为这些预簇的采样样本,并对剩余预簇进行下一轮采样,直到所有预簇的置信区间都不重叠,或者剩余预簇内没有增加样本则结束采样,得到所有预簇的采样样本; 由此得到采样后预簇情感分布向量,即一级节点的情感分布向量,向量中每个维度的元素即为其对应预簇的采样样本的平均情感值; 步骤5计算每个一级节点的情感分布向量对全局情感分布的贡献; ;表示第个一级节点的情感分布向量对全局情感分布的贡献值,,为一级节点数量,,;和分别表示预簇和预簇采样样本的平均情感值;为一个判断函数,则,否则;为另一个判断函数,则,则; 如果采样率小于设定的采样率阈值,为社交媒体数据集的数据项总数,为采样的数据项数量,则对贡献值最低的一级节点对应的二级节点所包含的所有预簇进行重新采样,直至达到设定的采样率阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学上虞科学与工程研究院有限公司,其通讯地址为:312000 浙江省绍兴市上虞区曹娥街道五星西路外五甲村上虞产教融合创新园1期复兴西路77号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。