重庆邮电大学牟以恒获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种基于对比学习的药物靶标智能推荐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119601077B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411664907.8,技术领域涉及:G16B15/30;该发明授权一种基于对比学习的药物靶标智能推荐方法是由牟以恒;王进;傅敬雯;刘克林设计研发完成,并于2024-11-20向国家知识产权局提交的专利申请。
本一种基于对比学习的药物靶标智能推荐方法在说明书摘要公布了:本发明属于计算生物学,具体涉及一种基于对比学习的药物靶标智能推荐方法;该方法包括:获取药物和靶标信息,包括药物的SMILES序列和靶标蛋白的氨基酸序列;使用药物编码器和靶标蛋白编码器得到药物和靶标蛋白的表征信息;设计自适应注意力机制,通过不同的掩码方法实现药物靶标表征向量与可学习的查询向量之间的交互,利用对比学习对齐药物表征空间和靶标蛋白表征空间;根据交互后得到的查询向量得到药物靶标之间的匹配的概率;选取概率大于阈值的药物靶标推荐给用户;本发明预测结果准确率高,有助于减少生物医学研究者挖掘药物靶标反应对的时间,减轻研究负担。
本发明授权一种基于对比学习的药物靶标智能推荐方法在权利要求书中公布了:1.一种基于对比学习的药物靶标智能推荐方法,其特征在于,包括: 获取待预测的药物靶标信息,将其输入到训练好的药物靶标推荐模型中,选取预测概率大于交互阈值的药物靶标推荐给用户; 药物靶标推荐模型的训练过程包括: S1:获取药物靶标信息,包括药物的SMILES序列和靶标蛋白的氨基酸序列; S2:根据药物的SMILES序列将其转化为分子图结构,根据分子图中每个原子和化学键的化学性质为其设置初始特征向量;将靶标蛋白的氨基酸序列拆分为重叠的三元氨基酸子序列,为每个子序列设置随机向量作为初始特征向量; S3:利用基于图神经网络的药物编码器抽取出药物表征向量hd,利用基于序列的靶标蛋白编码器抽取出靶标蛋白表征向量hp; 利用基于图神经网络的药物编码器抽取出药物表征向量hd,利用基于序列的靶标蛋白编码器抽取出靶标蛋白表征向量hp,包括: 药物表征向量hd计算公式为: hd=concat{GnnEncoderv:v∈D} 其中,基于图神经网络的药物编码器GnnEncoder的计算公式为: 其中,D表示药物分子中的原子集合,h0u表示原子u根据其化学性质设置的初始特征向量,Nv表示与原子v邻接的原子集合,Wd表示第一可训练参数矩阵,concat表示特征向量拼接,药物表征向量hd的维度为n×d,n表示药物分子中的原子数量,d表示每个原子的特征维度; 靶标蛋白表征向量hp计算公式为: hp=GnnEncoderX 其中GnnEncoder的计算公式为: 其中,为第二、第三可训练参数矩阵,b表示可训练的偏置参数,σ表示Sigmoid函数,X表示初始氨基酸序列中三元组子序列的特征向量,靶标蛋白向量hp的维度为l×d,l表示靶标蛋白的氨基酸序列中三元组子序列的长度; S4: 设计随机初始化查询向量hq、多层自适应注意力模块,实现查询向量hq与药物表征向量hd和靶标蛋白表征向量hp分别进行交互,得到交互了查询向量和药物表征的向量Hd、交互了查询向量和靶标蛋白表征的向量Hp和交互了药物表征和靶标蛋白表征的查询向量Hq,包括: S41:设置随机初始化查询向量hq,维度为m×d,m表示查询向量hq的特征长度,d表示hq的特征维度; S42:将药物表征向量hd与查询向量hq拼接后输入掩码策略为的多层自适应注意力模块中,得到交互后的特征向量Hd; 第一层自适应注意力模块的输入为:维度为n+m×d,||表示拼接操作,其中,n表示药物分子中的原子数量; S43:将靶标蛋白表征向量hp与查询向量hq拼接后输入掩码策略为的多层自适应注意力模块中,得到交互后的特征向量Hp; 第一层自适应注意力模块的输入为:维度为m+l×d,||表示拼接操作; S44:将查询向量hq分别和药物表征向量hd和靶标蛋白表征向量hp拼接后输入掩码策略为Mcross的多层自适应注意力模块中,得到特征向量和取出其中属于查询向量的部分得到交互了药物靶标表征信息的查询向量Hq; 从特征向量和中取出其中属于查询向量的部分得到交互了药物靶标表征信息的查询向量Hq,包括: 其中,表示向量第n个位置到第n+m个位置的特征向量,表示向量第1个位置到第m个位置的特征向量,α表示用于控制和重要性的一个可训练参数; S5:将匹配的药物靶标对作为正样本,利用交互特征Hp和Hd计算对比学习损失,对齐药物和靶标蛋白的表征空间,同时对药物分子图中每个原子的特征向量添加扰动,提高药物表征的泛化能力; 将匹配的药物靶标对作为正样本,利用交互特征Hp和Hd计算对比学习损失,对齐药物和靶标蛋白的表征空间,包括: S5-11:对于每对输入的药物分子d和靶标蛋白p,将其作为一个正样本对; S5-12:对每个药物分子d,从所有的靶标蛋白数据中随机采样出k个组成集合对每个靶标蛋白p,从所有的药物分子数据中随机采样出k个组成集合 S5-13:在集合中,利用交互特征Hp和Hd计算对比学习损失,实现对齐药物和靶标蛋白的表征空间; 对药物分子图中每个原子的特征向量添加扰动,提高药物表征的泛化能力,包括: S5-21:利用所有药物分子数据的药物表征向量hd得到均值维度为n×d; S5-22:对每个药物分子d进行扰动,得到与药物分子d表征向量hdd相似但存在细粒度不同的特征向量 S5-23:在一个训练批次中,药物分子d表征向量与扰动后的特征向量作为正样本,与其他药物分子作为负样本计算对比损失,增强药物分子特征表示的泛化能力; 对每个药物分子d进行扰动,得到与药物分子d表征向量hdd相似但存在细粒度不同的特征向量包括: 其中,hdd表示药物d的表征向量,‖*‖2表示求向量的平方,ε表示用于控制扰动程度的可训练的参数,范围为0到1,表示所有药物分子数据的药物表征向量的均值; S6:查询向量Hq经过线性层输出药物靶标的匹配概率,根据已知的药物靶标匹配标签计算匹配损失,并与对比学习损失相加作为最终的损失来更新模型的参数,得到训练好的药物靶标推荐模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励