深药科技(苏州)有限公司张阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深药科技(苏州)有限公司申请的专利一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116364209B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310189286.1,技术领域涉及:G16C20/50;该发明授权一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法是由张阳;胡俊;李阳设计研发完成,并于2023-03-02向国家知识产权局提交的专利申请。
本一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法在说明书摘要公布了:本发明公开了一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法,本发明一方面,从序列信息出发,利用蛋白质语言模型来提取受体蛋白质与新设计的多肽的特征表示,并搭建深度神经网络模型,来预测受体蛋白质与多肽的绑定概率,为提升多肽设计性能做好了准备;另一方面,利用蒙特卡洛算法设计长度不等的多肽序列,并利用上述深度神经网络模型来评估新设计的多肽与受体蛋白质的绑定概率,最高绑定概率对应的多肽序列为最终的设计结果。
本发明授权一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法在权利要求书中公布了:1.一种基于蛋白质语言模型与蒙特卡洛的多肽设计方法,其特征在于,所述方法包括以下步骤: S1、输入一条待进行多肽配体设计的蛋白质序列S; S2、随机生成一条残基数为l的多肽序列P; S3、搭建深度神经网络预测蛋白质序列S与多肽序列P的绑定概率; S4、收集PDB数据库中已被测定会发生相互作用的蛋白质与多肽序列对数据,构建训练集合来训练步骤S3中搭建的深度神经网络模型,获得训练后的深度神经网络模型; S5、采用蒙特卡洛算法,使用步骤S4中训练后的深度神经网络模型作为能量函数,生成蒙特卡洛轨迹,轨迹中的任一点为一个潜在的多肽设计结果: S501、利用步骤S4中训练的深度神经网络模型,来预测蛋白质序列S与多肽序列P的绑定概率,记作E; S502、随机生成一个1到5之间的整数R,若R为1,则随机从20种常见氨基酸类型中挑选一种氨基酸类型,将该类型的一个氨基酸放置在多肽序列P的N端;若R为2,则随机从20种常见氨基酸类型中挑选一种氨基酸类型,将该类型的一个氨基酸放置在多肽序列P的C端;若R为3,则从多肽序列P的N端删除一个氨基酸;若R为4,则从多肽序列P的C端删除一个氨基酸;若R为5,随机从多肽序列P中挑选一个氨基酸,并将其替换成一个随机类型的氨基酸;将上述新生成的多肽序列记作Pnew; S503、利用步骤S4中训练的深度神经网络模型,来预测蛋白质序列S与步骤S502中生成的多肽序列Pnew的绑定概率,记作Enew; S504、若Enew大于E,则Pnew为蒙特卡洛轨迹中的一个点,并将Pnew作为多肽序列P重新执行步骤S501至步骤S503;若Enew小于等于E,则随机生成一个0到1之间的数rd,若rd小于eEnew-ET,T为蒙特卡洛算法中的温度参数,则Pnew为蒙特卡洛轨迹中的一个点,并将Pnew作为多肽序列P重新执行步骤S501至步骤S503,否则直接执行步骤S501至步骤S503; S505、上述过程重复执行,直至获得N个蒙特卡洛轨迹点结束,从这N个轨迹点中,选出与蛋白质序列S绑定概率最高的轨迹点作为最终设计的多肽序列P final ; 所述神经网络包含第一子模块、第二子模块、一层交叉注意力层以及一层全连接层;蛋白质序列S输入第一子模块,多肽序列P输入第二子模块,第一子模块和第二子模块的输出直接输入到交叉注意力层,交叉注意力层的输出输入到全连接层,得到S和P的绑定概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深药科技(苏州)有限公司,其通讯地址为:215000 江苏省苏州市工业园区星湖街218号生物医药产业园A4楼102单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。