浙江工业大学郑海斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利基于属性贡献度掩码的多源数据融合商品推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115880019B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211224278.8,技术领域涉及:G06Q30/0601;该发明授权基于属性贡献度掩码的多源数据融合商品推荐方法是由郑海斌;项云鹏;任启伟;杨洁;杨丁一;陈晋音设计研发完成,并于2022-10-08向国家知识产权局提交的专利申请。
本基于属性贡献度掩码的多源数据融合商品推荐方法在说明书摘要公布了:基于属性贡献度掩码的多源数据融合商品推荐方法,包括:1通过网络收集对于商品的评论,包括图片,文字,视频;2训练自编码器;3提取降维数据;4融合数据;5训练深度模型;6掩膜法计算权重;7获得每个维度数据的权重,对于每个数据中每一维度的权重进行微调;8对评分预测模型进行重训练,得到最终的评分预测模型;9采用知识图谱的方式进行预测,利用老产品数据预测新产品数据;10进行新老产品的评分预测,根据评分结果进行推荐。本发明提高了系统的准确性、系统输出的可信度。
本发明授权基于属性贡献度掩码的多源数据融合商品推荐方法在权利要求书中公布了:1.基于属性贡献度掩码的多源数据融合商品推荐方法,包括如下步骤: 1收集数据:通过网络收集关于饮料的评论,包括图片,文字,视频,经过处理后存入到数据集S0中; 2训练自编码器:由于往往从网络上收集的数据为多源数据,包含非结构化,半结构化以及结构化数据,对非结构化数据或者半结构化数据需要进行结构化,采用自编码器的方法进行求解,首先对自编码器进行训练,具体方法如下: 2.1自编码器是一个自监督学习的算法,将数据进行降维,通过训练映射f:x→x`,从而训练神经模型,具体方法如下: Ⅰ已有无标签的数据集S0,将其中的70%存入空数据集S01中,作为训练集,剩余的30%的数据作为验证集存入空数据集S02中; Ⅱ利用训练集中数据,训练子网络M11来学习映射f1:x→z,其中z为一个维度小于m的数据,将所得到的z存入数据集S13中; Ⅲ利用得到的数据集S13中的数据z作为输入训练子网络M12,学习映射f:z→x`,其中x`为一个和原数据x相同维度的数据,将所得的x`存入数据集中 Ⅳ利用反向传播对两个子网络进行调整,将距离度量最小化的方式,来获得最终所需要的自编码器M1,其中距离度量的计算公式如下: 其中n代表训练的数据的数量,L代表距离度量; 3提取降维数据:使用步骤2中已训练的自编码器M1对多元数据进行融合,将已有数据集S0中需要融合的数据x输入到自编码器M1中,将所得到的中间产生的数据z取出,由于自编码器中间数据z相当于对输入数据进行了一次降维,因此相当于提取了数据中的共同特征; 4融合数据:将S0中的数据与其对应的中间数据z进行相加,将所得结果存入数据集S1中,作为训练模型的数据; 5训练深度模型:利用数据集S1中的数据训练深度模型M2,使用反向传播技术进行训练,将损失函数最小化,具体损失函数如下: 6计算权重:通过步骤5初步获得一个商品评分模型M2,但其中各维度属性权重依旧相同,为了提高准确度,使用掩膜的方法进行解决,具体方法如下: 6.1将S1中的数据输入到已有的评分模型M2中,即可获得输出结果即评分fx,每个数据都对应一个输出结果fxi; 6.2对每个数据评分fxi进行求导工作,求导结果gia,即为第i个数据中第a维数据关于输出结果fxi的影响程度,其中求导的具体公式如下: 其中i代表为第i个数据,xia代表第i个数据的第a维度数据; 6.3对每一维度的gia进行求均值,具体公式如下: gia代表第i个数据第a维度数据数据求导的结果,n为总数据数; 6.4对掩膜w进行求解,求解w的具体公式如下: wa=lg|ga|5 ga代表的是第a维度的平均影响程度; 7调整权重:根据公式5获得每个维度的权重,接下来对每个数据中每一维度的权重进行微调,微调的具体公式为: xia=xia*wa6 8重训练模型:对评分预测模型M2进行重训练,训练方式同步骤5,训练结果即最终的评分预测模型M2; 9对新产品进行评分预测:由于新产品样本数据较少,因此无法采用步骤1~8进行评分预测,采用知识图谱的方式进行预测,利用老产品数据预测新产品数据,具体方式如下: 9.1收集老用户以及老商品的相关数据,存入数据集S2中; 9.2计算老用户相互之间,老商品相互之间,老用户以及老商品之间的相关系数ρ,若相关系数大于0.5,则在两者之间进行联系的建立操作,相关系数的具体计算公式如下: 9.3利用深度优先遍历算法对用户与商品之间的联系进行求解,具体方式如下: Ⅰ设定初始点为老用户所处的位置; Ⅱ根据不同路径计算用户和商品间的相关系数,其值为路径中经过所有边所带的相关系数之积,其具体公式如下: ρx,j=ρx,i*ρi,j8 其中ρi,j为路径中两点的相关系数; Ⅲ选取某用户以及某商品之间相关系数最大的路径,该路径对应的相关系数作为最终该用户与该商品之间的相关系数; 9.4建立新用户,新商品与知识图谱的联系,计算新用户与老用户以及老商品之间的相关系数,大于0.5即视为建立联系; 9.5计算新用户,新商品与各个节点之间的评分,计算公式如下: ρi,j代表的是第j个老用户对第i个老商品的评分,simx,i代表一个人为评定的新商品与第i个老商品的相似程度,n为数据总量; 10制定推荐方案:至此推荐系统已成功建立,可以进行新老产品的评分预测,根据评分结果进行推荐。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励