桂林电子科技大学姜浩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉桂林电子科技大学申请的专利一种融合项目属性信息的序列推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116228323B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211700667.3,技术领域涉及:G06Q30/0251;该发明授权一种融合项目属性信息的序列推荐方法是由姜浩;陈金龙;宁毅设计研发完成,并于2022-12-28向国家知识产权局提交的专利申请。
本一种融合项目属性信息的序列推荐方法在说明书摘要公布了:本发明公开了一种融合项目属性信息的序列推荐方法,包括如下步骤:1数据预处理和项目属性嵌入;2抽取兴趣类别;3推荐项目;4训练过程。这种方法降低了模型噪声影响,消除异构属性信息之间的混合相关性,提高了模型性能。
本发明授权一种融合项目属性信息的序列推荐方法在权利要求书中公布了:1.一种融合项目属性信息的序列推荐方法,其特征在于,包括如下步骤: 1数据预处理和项目属性嵌入: 给定用户与系统的历史交互,序列推荐任务要求预测下一个交互的项目,若u表示用户,u的历史交互Vu用公式1中的括号表示的顺序元组为: 其中表示用户u进行的第j次交互,也称为行为,每个交互的项目都简单地用项目ID和项目属性表示,如公式2: 其中IDk∈I,代表项目词汇表中第k个项目的ID,I={ID1,ID2,...,IDm}是系统中要考虑的所有项目ID的标识集,m是问题域中的项目的总数,代表项目词汇表第k个项目的属性集,J={Attr1,Attr2,...,Attrr}是系统中所有项目属性的词汇表,r是问题域中的项目属性总数; 原始训练序列的长度是不确定的,需要转换为固定长度的序列S=S1,S2,...,Sn,n为模型能处理的最大长度,若序列长度大于n,取最近的n个项目,若序列长度小于n,则在序列左侧使用零填充,直到序列长度为n,因此n也是转换后所有定长序列的长度; 在将不定长序列转换为固定长度的序列后,将原始序列转换为嵌入序列,嵌入指嵌入向量,它是项目属性在推荐算法中的向量表示,嵌入层将不同类型的项目属性分开建模,将序列转化为项目的类别属性嵌入向量和ID嵌入向量,分别用于兴趣抽取模块和交叉预测模块; 1ID属性嵌入: 创建ID属性嵌入矩阵MID∈Rm×d,m为项目的总数,d为嵌入向量的维度,根据序列S中项目的ID,查找MID中对应的嵌入向量,将S转换为嵌入序列EID∈Rn×d,零填充项的ID属性嵌入为常数零向量; 2类别属性嵌入: 创建类别属性嵌入矩阵MCATE∈Rr×d,r是项目属性总数,d为嵌入向量的维度,由于项目的类别属性是类别元素的集合,是一对多的关系,不能像ID属性嵌入一样直接查找,需先将S中第i个项目的类别属性进行Muti-Hot编码,表示为向量ei的j位置值为1,则Si拥有编号为j的类别元素,序列的类别属性嵌入表示为公式3,零填充项的类别属性嵌入也为常数零向量: 3位置嵌入: 原始的注意力机制不包含序列的位置信息,无法识别序列中项目的先后顺序,通过添加位置编码可拟补这一不足,位置编码使用可学习的嵌入矩阵P∈Rn×d,位置嵌入和ID属性嵌入及位置嵌入和类别属性嵌入的融合操作均为向量对应位置相加,如公式4: 添加位置嵌入后的类别嵌入表示为ID属性嵌入表示为ID属性嵌入和类别嵌入使用的位置嵌入矩阵不共享; 2抽取兴趣类别: 兴趣抽取模块的主要结构是多头稀疏自注意力块,多头稀疏自注意力方法,是对多头自注意力方法的扩展,多头自注意力层和多层感知机两者串联在一起构成一个多头注意力块; 兴趣抽取模块从输入的类别嵌入中抽取用户的类别兴趣OCATE∈Rd,输入使用公式5获得查询向量Q、键向量K、值向量V: f·x=XW·5, 其中是可学习的投影矩阵,i代表第i个自注意力头,n是定长序列的长度,d为嵌入向量的维度,h为自注意力头的总数,在通过公式6获得注意力分数矩阵A: 显式选择是在A上做稀疏化操作,如公式7所示,Aij为序列中项目i与项目j的注意力分数,ti为关于项目i的第k个最大注意力分数,k是超参数: 然后对做归一化,如公式8: 为标准化分数,由于掩蔽函数将小于top-k的分数赋值为负无穷,其归一化分数即概率为0; 第i个头的值的聚合操作如公式9所示: Ci=AiVi9, 多头自注意力将每个头的输出串联在一起,并进行线性投影得到输出,如公式10,Wo是可学习的投影矩阵: MSAX=ConcatC1,...,ChWo10, 多层感知机在多头自注意力层之间,FC·为全连接层,W∈Rd×d,b∈Rd是可学习的投影矩阵和偏置,σ·为激活函数,如公式11所示: MLPX=FCσFCX,FCX=XW+b11, 多头自注意力和多层感知机上都使用ResidualConnections方法防止训练时梯度消失问题,使用LayerNormalization用来加速训练,并串联作为一个多头注意力块,Hl为第l块的输入,Gl为该块多头注意力层的输出,如公式12: 输入的类别嵌入在经过一个或多个多头稀疏自注意力块以后,输出OCATE,代表用户的类别兴趣,用于计算辅助损失函数及交叉预测模块预测兴趣项目; 3推荐项目: 交叉预测模块的主要结构是多头交叉注意力块,多头交叉注意力块由交叉注意力块和多层感知机串联而成,自注意力方法使用序列内的信息聚合序列,而交叉注意力方法能够引入额外的信息来聚合序列,交叉预测模块输入类别兴趣OCATE和ID嵌入使用交叉注意力方法,输出项目兴趣OID∈Rd; 交叉预测模块查询向量来自兴趣抽取模块的输出OCATE,而键向量和值向量则来自ID嵌入序列 如公式13: 线性变换f·x见公式5,其投影矩阵与稀疏自注意力模块的投影矩阵不共享; 注意力矩阵计算过程如公式6,多头聚合操作和多层感知机与多头注意力块一致,见公式9、10、11、12,OID与项目ID嵌入向量的内积用于衡量用户对该项目的兴趣,内积越大,用户对该项目有兴趣的概率越大; 4训练过程: 采用二元交叉熵损失函数进行模型优化,定义N为训练序列的数量,t为序列中的时刻,e[t+1]∈Iu作为正例,表示用户在t+1时刻交互的项目,作为负例,表示随机抽取的用户在t+1时刻没有交互过的项目,Iu是用户u交互过的项目的集合,I是全部项目的集合,O[t]表示模型输出的t时刻的兴趣,lg是对数函数,σ是sigmoid函数,·为内积运算; 损失函数定义为公式14,系统中所有序列的全部时刻模型输出的兴趣与正例和负例的二元交叉熵损失的和为: 为使兴趣抽取模块学到有意义的兴趣表示,模型使用辅助损失函数,将兴趣抽取模块输出的OCATE、作为正例的类别嵌入序列eCATE和作为负例的随机抽取的类别嵌入序列作为辅助损失函数的输入,同样的,目标损失函数将交叉预测模块输出的OID、作为正例的ID嵌入序列eID和作为负例的随机抽取的类别嵌入序列作为输出,如公式15: 最终模型的损失函数为目标项目损失Ltarget与辅助损失Laux相结合,β是超参数,用于平衡目标损失和辅助损失,如公式16: L=Ltarget+β*Laux16。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人桂林电子科技大学,其通讯地址为:541004 广西壮族自治区桂林市七星区金鸡路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励