Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中科(厦门)数据智能研究院赵鹏获国家专利权

中科(厦门)数据智能研究院赵鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中科(厦门)数据智能研究院申请的专利一种用于商品标题聚类的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116561307B

龙图腾网通过国家知识产权局官网在2025-10-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310319569.3,技术领域涉及:G06F16/35;该发明授权一种用于商品标题聚类的方法及系统是由赵鹏;张钊;庄福振;徐勇军设计研发完成,并于2023-03-29向国家知识产权局提交的专利申请。

一种用于商品标题聚类的方法及系统在说明书摘要公布了:本发明公开了一种用于商品标题聚类的方法及系统,具体涉及文本聚类技术领域,用于解决现有公开技术通常是针对通用数据的技术方案,也有方案是针对这类数据的,但是由于应用场景不同,这类方案并不完全适用的问题,其方法包括爬取数据、商品标题归一化、语义向量转换、相似度分析、聚类分析以及相似商品的搜索推荐,系统由硬件和软件构成,软件包括爬虫模块、加工模块、语义向量模块、相似度计算模块、聚类模块以及推荐模块,硬件包括CPU、内存条、存储件以及GPU;是通过对网上商品交易信息数据进行竞品分析,获取商品标题的相似度并对商品标题的相似度进行聚类分析以及搜索推荐,从而提高聚类和搜索推荐的准确度。

本发明授权一种用于商品标题聚类的方法及系统在权利要求书中公布了:1.一种用于商品标题聚类的方法,其特征在于,包括如下步骤: 步骤S1,利用爬虫获取交易网站的商品标题数据; 步骤S2,根据商品标题数据,进行加工,获取到其中两个核心片段,一个是核心内容片段,另一个是核心内容补充片段,将两个片段合并得到商品标题的归一化词;获取核心内容片段及核心内容补充片段的步骤包括: 步骤S21,对商品标题进行分词; 步骤S22,对所有的商品标题分词结果进行词频统计,将其中高频词中标注出停用词,其中停用词包括但不局限于“的”,“和”以及“与”其中的一种、两种或者三种; 步骤S23,获取步骤S22所有分词结果的词频排序,保留商品标题中最高频非停用词作为核心内容片段; 步骤S24,将分词结果中最后一个非停用词作为核心内容补充片段; 步骤S25,如果核心内容片段与核心内容补充片段为同一词,则选取次最高频词作为核心内容片段; 步骤S26,合并词语,将核心内容片段和核心内容补充片段采用字符串拼接的方式合并,形成一个新的字符串,并将这个新的字符串作为商品标题归一化词; 步骤S3,根据上述获取的商品标题归一化词,转化成语义向量; 步骤S4,将语义向量进行cos距离计算,获取商品之间的相似度指标,利用该结果完成商品的聚类以及相似商品的搜索推荐。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科(厦门)数据智能研究院,其通讯地址为:361021 福建省厦门市软件园三期凤岐路208-3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。