东北大学梁玉亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利基于因果推断的药物推荐系统及方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119811576B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510292960.8,技术领域涉及:G16H20/10;该发明授权基于因果推断的药物推荐系统及方法是由梁玉亮;郭贵冰设计研发完成,并于2025-03-13向国家知识产权局提交的专利申请。
本基于因果推断的药物推荐系统及方法在说明书摘要公布了:本发明提供一种基于因果推断的药物推荐系统及方法,涉及数据挖掘技术领域,本系统使用深度学习模型,具体包含患者状态编码器,医学检查自编码器,推荐模块;通过输入患者特征X,使用神经网络编码器将X投影到低维嵌入空间;使用编码‑解码器结构重建医学检查数据R,获得R的替代低维隐变量Z R ,并计算重建损失;使用对比学习优化低维隐变量Z R ,并计算对比学习损失;根据患者特征X和医学检查的隐变量Z R 预测合适的药物,并计算推荐损失;联合优化重建损失、对比学习损失和推荐损失优化药物推荐系统参数,建立患者和药物的因果关系PY|doX,提升药物推荐系统的推荐能力。最后通过联合患者特征和医学检查数据使用药物推荐系统进行药物推荐。
本发明授权基于因果推断的药物推荐系统及方法在权利要求书中公布了:1.一种基于因果推断的药物推荐系统,其特征在于,使用深度学习模型,具体包含患者状态编码器,医学检查自编码器,推荐模块; 所述患者状态编码器输入患者特征X,使用多层感知机将高维的患者特征X映射到低维隐空间,生成患者状态的隐变量ZX,表示为: ZX=fencX,θX 其中,fenc为患者状态编码器的神经网络模型,θX为模型参数; 所述医学检查自编码器使用编码器-解码器结构处理医学检查数据R,提取关键特征并压缩到低维空间,构建替代低维隐变量ZR; 其中所述编码器-解码器结构采用变分自编码器VAE结构,具体包含编码器和解码器两个模块,如下所示: ZR=fvae-encX,φenc 其中,fvae-enc和fvae-dec为编码器、解码器,φenc和φdec为编码器、解码器参数,为重建的医学检查数据; 在变分自编码器VAE中,替代低维隐变量ZR的先验分布被设定为标准多元正态分布: PZR=N0,I 其中,N0,I表示均值为0,协方差矩阵为单位矩阵I的多元正态分布; 所述推荐模块为协同过滤模型,即因子分解机FM;将患者状态隐变量ZX和低维隐变量ZR作为输入,为每位患者提供药物推荐,推荐模块的输出为条件概率PY|R,X,表示每种药物y∈Y的推荐概率;具体如下: Y=frecommendZX,ZR;φY 其中frecommend是推荐模块;φY是推荐模块的参数,输出为一个多分类概率分布,表示每种药物的推荐概率PY|R,X; 所述编码器输入医学检查数据,生成替代低维隐变量ZR的后验分布qZR|R作为编码器的输出: qZR|R=Nμ,diagσ2 其中,μ和σ分别是替代低维隐变量ZR的均值和标准差,diag表示对角矩阵; 所述解码器以低维隐变量ZR为输入,将编码的隐变量映射回原始输入空间,重构原始数据生成对医学检查数据R的重建向量,即重建的医学检查数据 所述变分自编码器VAE的训练目标是最小化总损失函数LVAE,总损失函数LVAE包括重建损失以及KL散度损失: 所述重建损失为条件对数似然的负期望: 其中,表示期望值,logPR|ZR是对数似然项,表示在低维隐变量ZR的条件下,观测数据R的概率; 若条件分布PR|ZR假设为正态分布,展开为均方误差形式: 其中,Ri和为第i个样本的原始和重建后的医学检查数据; 所述KL散度损失具体为: 其中,DKL表示Kullback-Leibler散度;d是隐变量的维度,和分别是第i个隐变量的均值和标准差,qZR|R为给定医学检查R情况下低维隐变量ZR的后验分布; 通过超参数β平衡重建损失和KL散度损失,则总损失函数LVAE有: LVAE=Lreconstruct+β·LKL 使用对比学习进一步优化替代低维隐变量ZR,捕捉医学检查数据R和患者特征X之间的因果关联,即优化对比概率后验概率PX|ZR和先验概率PX的比值; 所述对比学习中:正样本为来自同一患者的数据对X,R,R是目标患者的医学检查数据,X是对应的患者特征;负样本为随机选择患者特征X′和目标患者的医学检查数据R组合即X’,R;对比学习通过拉进正样本对的距离,推远负样本的距离,计算对比概率具体采用InfoNCE损失函数作为对比学习损失,其定义如下: 其中,τ为温度系数,i,j表示正负样本索引,Xi,Xj为索引的正负样本,为患者i的医学检查R的替代隐变量,N为负样本数量,sim·,·为相似度函数;相似度函数sim·,·表示替代变量和患者特征的相似度,采用余弦相似度计算: 所述推荐模块中,使用推荐损失Lrecommendation衡量模型预测的药物推荐概率与实际药物标签之间的偏差,其定义为多分类交叉熵损失: 其中,N表示患者数量;K为药物数量;i为患者索引;k药物类别索引,yi,k表示患者i在药物k上的真实标签;Pyi,k|Ri,Xi表示患者i在药物k的预测概率; 综合重建损失、对比学习损失和推荐损失,构建联合优化目标Ltotal: Ltotal=λ1·Lreconstruct+λ2·Lcontrast+λ3·Lrecommendation 式中λ1,λ2,λ3分别衡量重建损失、对比学习损失和推荐损失的重要性权重; 所述药物推荐系统对应的因果图中,变量X表示患者特征,变量R表示医学检查数据,Y表示患者适合的药物集合,C表示未观察到的协变量;药物推荐系统旨在挖掘X→Y的因果关系,识别因果效应PY|doX;存在一种因果路径:X→R→Y,其中患者适合的药物集合Y以患者特征X和医学检查结果R为条件; 基于因果推断中的前门调整得到如下因果效应: 其中,PY|doX表示X对Y的因果效应;doX表示对X进行干预操作;ZR为替代R的低维隐变量,PZR和PX为低维隐变量ZR和X的概率分布;PX|ZR表示给定ZR时X的概率分布,PY|X,R表示给定X和R时的Y的概率分布; 对药物推荐系统进行训练,优化三个概率项PZR,和PY|X,R,得到X对Y的因果效应,并消除未观察到协变量C产生的混淆作用;具体通过优化上述重建损失、对比学习损失和推荐损失,对因果效应进行近似估计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。