南京邮电大学陆家豪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京邮电大学申请的专利面向商品评论的基于对比学习的用户个性化偏好建模方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120104885B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510582692.3,技术领域涉及:G06F16/9535;该发明授权面向商品评论的基于对比学习的用户个性化偏好建模方法是由陆家豪;姚遥;吴严生;王睿设计研发完成,并于2025-05-07向国家知识产权局提交的专利申请。
本面向商品评论的基于对比学习的用户个性化偏好建模方法在说明书摘要公布了:本申请属于自然语言处理技术领域,公开了一种面向商品评论的基于对比学习的用户个性化偏好建模方法,包括:构建语料库并进行数据预处理;对文档进行数据增强得到成对的文档对;将成对的文档通过LLM进行主题分配,并将结果输入文档的主题分布的向量表示;将成对的文档通过LLM进行主题分配得到文档‑主题分布,并将用户索引输入用户推断网络获得用户偏好分布;将文档‑主题分布与用户偏好分布点乘获得个性化文档‑主题分布;从狄利克雷分布中采样先验分布;最小化狄利克雷先验分布对齐的先验损失和对比学习损失,从而训练用户推断网络。本申请能够有效地分析电商平台用户的偏好。
本发明授权面向商品评论的基于对比学习的用户个性化偏好建模方法在权利要求书中公布了:1.一种面向商品评论的基于对比学习的用户个性化偏好建模方法,其特征在于:所述用户个性化偏好建模方法包括以下步骤: 步骤1、通过筛选带有商品类别信息的评论文本构造数据集,并对构造的数据集进行数据预处理; 步骤2、对步骤1的评论文本使用同义词替换进行数据增强,获得语义相近的评论文本对; 步骤3、将步骤2中得到的数据增强后的语义相近的评论文本对通过大语言模型LLM进行主题分配,具体包括如下步骤: 步骤3.1、通过构造prompt指令将正样本对中的文档样本x∈Xa∪Xb中的每个单词分配到单词所属于的预定义的类别集合上; 步骤3.2、对于每篇文档样本,生成一个维度与主题数相同且所有元素初始化为零的向量作为该文档样本的初始文档-主题向量,每个文档样本中每个单词的主题分配采用计数形式,若单词分配到了该单词属于的类别,则该文档样本的文档-主题向量的对应的主题索引的位置加1,统计完成后对文档-主题向量通过softmax函数计算得到所述文档样本x的文档-主题分布向量δwm,tj: 其中,是文档样本x第j个主题分配到的计数,wm是文档样本x中第m个单词,tj是数据集中第j个主题,N是文档样本x中的单词数量,是文档-主题向量的第j个位置的值,δwm,tj是判断函数; 步骤4、创建用户推断网络,将用户索引输入用户推断网络,得到用户偏好分布,用户评论文本通过大语言模型LLM分配主题,获得文档-主题分布,将文档-主题分布与用户偏好分布点乘,得到用户个性化文档-主题分布;具体包括如下步骤: 步骤4.1、将用户u建模为嵌入表示: 其中,U是用户推断网络的嵌入层,Id[u]是用户索引; 步骤4.2、将所述用户索引Id[u]输入用户推断网络的嵌入层,获得用户嵌入Eu; 步骤4.3、将步骤4.2中获得的用户嵌入Eu映射为K维的用户偏好分布 其中,是全连接层的权重矩阵,R是维度,Hu是用户推荐网络的隐藏层的大小,b3是偏置项,K是主题数量,ReLU·是激活函数,Softmax·用于将文档-主题向量转化成概率分布; 步骤4.4、用第一次数据增强文档通过大语言模型LLM分配主题,获得文档-主题分布 步骤4.5、将步骤4.3中的用户偏好分布与步骤4.4中用户u对产品i发表的评论文本的第一次数据增强文档的文档-主题分布点乘得到K维的用户个性化文档-主题分布 其中,是点乘,是K维的用户个性化文档-主题分布; 步骤5、通过最小化对比学习损失和相关对齐损失来训练用户推断网络;具体包括如下步骤: 步骤5.1、构造用户推断网络,使用优化器,用户推断网络练损失函数为用户感知对比学习损失LU和相关对齐损失 步骤5.2、从数据集中采样并通过大语言模型LLM得到文档-主题分布,同时采样对应的用户索引输入用户推断网络,通过将得到的文档-主题分布和用户偏好分布点乘后获得用户个性化文档-主题分布,并且从服从参数为的狄利克雷分布中采样得到先验分布Θ”; 步骤5.3、通过优化用户感知对比学习损失LU和相关对齐损失进行随机梯度下降,从而更新用户推断网络的参数; 步骤5.4、重复步骤5.2和步骤5.3,直至用户推断网络收敛。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210046 江苏省南京市栖霞区文苑路9号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。