北京航空航天大学邓岳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京航空航天大学申请的专利一种基于流模型的抗体序列结构协同设计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114360636B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210001847.6,技术领域涉及:G16B5/00;该发明授权一种基于流模型的抗体序列结构协同设计方法是由邓岳;郭弢设计研发完成,并于2022-01-04向国家知识产权局提交的专利申请。
本一种基于流模型的抗体序列结构协同设计方法在说明书摘要公布了:本发明公开了一种基于流模型的抗体序列结构协同设计方法,包括以下步骤:S1、选取结构抗体数据集作为通用的抗体数据;S2、获取氨基酸序列信息及结构信息;S3、将序列信息及结构信息编码入图神经网络,对神经网络进行更新,得到氨基酸编码;S4、将氨基酸编码输入至第一流模型中进行变换,得到氨基酸类型,将预测到的氨基酸类型输入图神经网络,对其进行更新,得到新的氨基酸编码;S5、将新的氨基酸编码输入至第二流模型中进行变换,得到氨基酸的三维坐标信息;S6、将氨基酸类型及三维坐标信息与真实值做损失函数,最小化损失函数,优化生成模型参数。
本发明授权一种基于流模型的抗体序列结构协同设计方法在权利要求书中公布了:1.一种基于流模型的抗体序列结构协同设计方法,其特征在于,包括以下步骤: S1、选取结构抗体数据集作为通用的抗体数据; S2、获取氨基酸序列信息及结构信息; S3、将序列信息及结构信息编码入图神经网络,对神经网络进行更新,得到氨基酸编码; S4、将氨基酸编码输入至第一流模型中进行变换,得到氨基酸类型,将预测到的氨基酸类型输入图神经网络,对其进行更新,得到新的氨基酸编码; S5、将新的氨基酸编码输入至第二流模型中进行变换,得到氨基酸的三维坐标信息; S6、将氨基酸类型及三维坐标信息与真实值做损失函数,最小化损失函数,优化生成模型参数; 所述步骤S3具体包括: 建立图结构并将序列信息和结构信息编码,当获取氨基酸序列的结构信息后,用原子的三维坐标来代表其所对应的氨基酸的空间位置,每一个氨基酸视为图结构中的一个节点,在序列中相邻的氨基酸节点将以边进行连接,此外,对于每一个氨基酸而言,与其距离最近的6个氨基酸也被视为其相邻节点,用边将后六者与前者连接,完成图结构的建立后,利用结构信息和空间几何知识,求得蛋白质主链上每一个氨基酸位置的扭转角,将正余弦处理过的扭转角信息编码为图结构中的节点特征: ; 在图结构中两个相邻的氨基酸的空间位置都由其对应的原子的三维坐标表示,因此将欧氏距离编码为图结构中的边特征: ; 其中,为第i个氨基酸中原子的三维坐标,第j个氨基酸在图结构中与第i个氨基酸相邻; 图神经网络的更新,依据上述图结构及其对应的节点和边特征,对图神经网络更新L次,每次的更新公式为: ; 其中,为上一次更新的节点隐藏状态,;为与氨基酸类型相关的编码;为边的特征;为两层全连接网络;为20维的行向量; 上述图神经网络的更新,可以得到每一个氨基酸节点的隐藏状态,表述为: ; 其中,;为上述构建的图结构;表示图神经网络的更新方式; 所述步骤S4具体包括: 经过流模型变换预测新点的氨基酸类型,得到第t+1个氨基酸的隐藏状态,对其进行16层流模型变换: ; 其中,预测的氨基酸类型,为独热编码;为第k层流模型变换的可学习参数; 所述步骤S5具体包括: 将代入建立图结构,利用更新图神经网络的方式得到每个点新的隐藏状态: ; 其中,的网络参数与步骤S3的不同;为9维的行向量; 得到每一个点新的隐藏状态后,对其进行16层流模型变换: ; 其中,预测主链上每一个氨基酸对应的原子三维坐标;为第k层流模型变换的可学习参数; 所述步骤S6具体包括: 生成模型的训练:步骤S1获得了抗体通用数据集,步骤S2-步骤S5将序列和结构信息整合,利用图神经网络预测每一个氨基酸的类型及主链上每个氨基酸原子的三维坐标;与数据集中对应的真实抗体对比,构建损失函数;对于氨基酸类型,选取交叉熵作为损失函数: ; 其中,T为人为设定的序列长度;为数据集中对应第t个氨基酸的独热编码的第i维;为预测的第t个氨基酸的独热编码的第i维; 对于三维坐标,选取最小二乘作为损失函数: ; 其中为真值的三维坐标; 生成模型总的损失函数为: ; 将损失函数构建好之后,反向传播,利用梯度下降最小化损失函数Loss,更新生成模型的参数,实现模型的训练; 分类器的训练:选取针对某种抗原的特异性抗体数据集,预训练一个分类器,对于此分类器,输入的是抗体序列结构及抗原序列结构,输出的是对抗原抗体能否特异性结合的预测;对于抗体的序列及结构,利用图结构创建及图神经网络的处理方式,得到每一个氨基酸的隐藏状态:;; 将每一个氨基酸的隐藏状态求和,对序列长度取平均,可得的隐藏状态: ; 对于抗原的氨基酸序列及结构,利用上述图结构创建及图神经网络的处理方式,得到每一个氨基酸的隐藏状态: ; 将每一个氨基酸的隐藏状态求和,对序列长度取平均,可得的隐藏状态: ; 得到抗体和抗原的隐藏状态后,通过两层神经网络预测二者是否能结合: ; 其中,函数输出概率值;为两层神经网络,输出标量;为向量拼接操作,将交叉熵作为真值与预测值的损失函数,训练分类器; 得到此分类器之后,给定一个FR区,利用上一步训练好的生成模型生成抗体氨基酸序列;对于特定序列及结构的抗原,将生成好的抗体氨基酸序列及结构通过分类器进行预测,如果预测得到的抗原抗体结合可能性高,则将此生成抗体加入到对某种抗原的特异性抗体数据集中;将生成的抗体氨基酸序列与抗体数据集中的抗体序列做比对,得到损失函数,反向传播,利用梯度下降最小化损失函数以微调模型; 利用上述分类器对生成的抗体的特异性结合概率进行打分,概率越高表明抗体和抗原的特异性结合能力越强,强化学习鼓励得分高的抗体序列生成,并以此为依据对模型进行微调,微调方式为: ; ; 其中,为生成模型的参数;为给定的学习率;为分类器的预测概率;为生成模型生成给定序列的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京航空航天大学,其通讯地址为:100191 北京市海淀区学院路37号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励