Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 南京行者易智能交通科技有限公司熊林海获国家专利权

南京行者易智能交通科技有限公司熊林海获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉南京行者易智能交通科技有限公司申请的专利一种基于大数据的个性化推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116127192B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211741970.8,技术领域涉及:G06F16/9535;该发明授权一种基于大数据的个性化推荐方法是由熊林海;周金明设计研发完成,并于2022-12-31向国家知识产权局提交的专利申请。

一种基于大数据的个性化推荐方法在说明书摘要公布了:本发明公开了一种基于大数据的个性化推荐方法,本发明将elasticsearch数据存储搜索和基于用户的协同过滤算法以及基于项目的协同过滤推荐算法相结合。对于新用户推荐elasticsearch数据库中点击率最高的前15条数据。对于老用户,采用基于用户的协同过滤算法及基于项目的推荐算法的推荐结果进行线性加权融合,选择出排名前10条的数据进行推荐。本发明通过网络爬虫的高度自动化,可以定时的更新数据库;其次,通过将TF‑IDF算法与协同过滤算法的结合,可以在一定成俗上缓解数据的稀疏问题。

本发明授权一种基于大数据的个性化推荐方法在权利要求书中公布了:1.一种基于大数据的个性化推荐方法,其特征在于,该方法包括如下步骤: 步骤1:利用网络爬虫技术,指定字段,包括:标题、发布时间、施行时间、时效性、正文,从相关网站获取数据; 步骤2:对爬取下来的数据首先对字段进行处理,去除无意义的数据并对数据进行去重,其次根据标题以及数据衍生地区新字段,最后将清洗完成的数据保存为json格式; 将保存为json格式的数据导入至elasticsearch数据库中,选择与elasticsearch版本相对应的ik分词器,并使用最细粒度ik_max_word创建索引;使用最少切分ik_smart进行搜索; 步骤3:构建基于用户的协同过滤算法,根据用户对某个数据的历史行为信息,包括搜索、评论和收藏,构建一个大小为m×n的用户-数据矩阵U,如下所示: 其中,m表示用户数,n表示数据总数,若用户对某条数据有过历史行为,则进行评分,umn表示用户m对数据n的评分,若没有过历史行为,则赋值0; 根据数据的标签信息构建一个n×s的数据-标签矩阵C,如下所示: 其中,n表示数据总数,s表示标签总数,cns表示数据n是否包含标签s,如果包含,则赋值1,否则,赋值0; 根据矩阵U和矩阵C,构建一个大小为m×s的用户-标签偏好矩阵P,如下所示: 其中,m表示用户总数,s表示标签总数,pms表示用户m对标签s的偏好程度; 利用TF-IDF算法,对用户-标签偏好矩阵P进行改进,具体如下: 其中,pua表示用户u对标签a的偏好程度,表示用户u对标签a的标记次数,表示用户u标记标签的总次数,表示标签的总次数,表示标签的总数,nua表示标注过标签a的用户数,nm表示总的用户数; 利用改进之后的用户-标签矩阵,采用余弦相似度,计算用户之间的相似度,其具体的计算公式如下所示: 其中,wu,v值越大,表示用户u与用户v越相似,因此向用户u推荐用户v偏爱的数据的概率就会越大;nu表示用户u偏爱的数据的集合,nv表示用户v偏爱的数据的集合;|nu∩nv|表示用户u和v共同偏爱数据的集合; 将相似度进行降序排列,找到与目标用户最相似的前k个用户,用集合Su,k表示,并计算得到目标用户u对数据i的偏好程度,具体计算公式如下: 其中,ni表示对数据i有过历史行为的用户的集合,uvi表示用户v对数据i有过历史行为信息的评分; 步骤4,构建基于项目的协同过滤算法的推荐结果,跟步骤3基于用户的协同过滤算法实现过程基本一致:第一步,根据不同用户对不同数据的历史行为信息,构建数据-用户矩阵;第二步,利用余弦相似度,计算数据之间的相似度;第三步,获得推荐结果,为目标用户推荐的数据是目标用户没有过历史行为,同时和目标用户有过历史行为的数据的相似程度又相对较高的数据,当推荐得分越高,即代表目标用户对推荐的数据越感兴趣; 步骤5:对于新用户推荐elasticsearch数据库中点击率最高的前15条数据;对于老用户,采用基于用户的协同过滤算法及基于项目的推荐算法的推荐结果进行线性加权融合,选择出排名前10条的数据进行推荐。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京行者易智能交通科技有限公司,其通讯地址为:210014 江苏省南京市秦淮区永智路6号南京白下高新技术产业开发区四号楼A栋102室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。