湖南大学彭绍亮获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南大学申请的专利基于生物分子互作结构域增强的蛋白质序列设计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119601074B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411611586.5,技术领域涉及:G16B15/20;该发明授权基于生物分子互作结构域增强的蛋白质序列设计方法是由彭绍亮;曾文武;许力文;窦钰涛;姬博亚;吕达锋设计研发完成,并于2024-11-12向国家知识产权局提交的专利申请。
本基于生物分子互作结构域增强的蛋白质序列设计方法在说明书摘要公布了:本发明公开了一种基于生物分子互作结构域增强的蛋白质序列设计方法,包括:先输入一个大小为L×N×3的待进行序列设计的蛋白质主链骨架三维坐标信息;获取与生物分子接触的蛋白质序列和相互作用结构域区间;将获取的序列聚类并取出每个簇的代表序列作为训练集;再提取出每条训练样本的三维结构、二级结构、溶剂可及性和功能注释特征表示;使用LoRA算法微调通用多模态蛋白质语言模型ESM3的最后十层transformer模块,对于位于相互作用结构域区间的掩码残基的损失给予更大的权重;将待进行序列设计的蛋白质主链骨架的原子坐标输入到训练好的模型中,得到目标序列。本发明一方面利用了海量蛋白质的多模态信息;另一方面能生成更加健壮且合理的功能性蛋白质序列。
本发明授权基于生物分子互作结构域增强的蛋白质序列设计方法在权利要求书中公布了:1.基于生物分子互作结构域增强的蛋白质序列设计方法,其特征在于,包括以下步骤: S1、输入大小为L×N×3的待进行序列设计的蛋白质主链骨架三维坐标信息C,其中,L为残基个数,N为每个残基的主链原子个数,3为每个原子的笛卡尔空间坐标; S2、获取与生物分子接触的蛋白质序列和相互作用结构域区间其中,N为序列集D中的序列总数,seqi表示序列集D中的第i条序列,domaini=[start,end]表示序列集D中的第i条序列的结构域区间,其中1≤start≤end; S3、将所述蛋白质序列D聚类成M个簇并取出所有簇的代表序列组成非冗余的序列集和对应的结构域区间集其中,M为非冗余序列集S中的序列总数; S4、预测所述序列集S中的每一条长度为G蛋白质序列seqi的三维结构信息并表示为PDB文件,将所述三维结构信息的原子坐标记作Coord; S5、计算所有的所述PDB文件得到每条蛋白质序列seqi的八态二级结构SS={s1,s2,…,sj,…,sG},其中,sj∈H,B,E,G,I,T,S,L表示蛋白质seqi的第j个残基的二级结构状态; S6、计算所有蛋白质序列seqi的PDB文件中每条蛋白质seqi的溶剂可及性表面积SA={a1,a2,…,aj,…,aG},其中,非负实值aj表示蛋白质seqi的第j个残基的溶剂可及性表面积; S7、获取所述序列集S中的每条蛋白质序列seqi的功能注释信息文件其中,表示FUN中第j条功能注释信息,N表示FUN中功能注释信息的总数目; S8、采用低秩自适应算法LoRA调整通用多模态蛋白质语言ESM3的最后10层transformer块的参数权重,并将该ESM3模型记作EiRA模型; S9、采用所述序列集S作为训练数据集训练所述EiRA模型,采用所述序列信息seqi、三维结构信息Coord、二级结构信息SS、溶剂可及性信息SA和功能注释信息FUN作为输入特征; S10、采用标准的随机区间掩码预测作为训练任务,在第一设定比例时,所述相互作用结构域区间domaini中的残基保持不被遮盖,在第二设定比例时,所述相互作用结构域区间domaini中被遮盖的残基的交叉熵损失乘以权重系数,损失函数为; 式中,随机掩码位置n∈domaini,x为残基特征对应的token令牌表示; S11、采用AdamW算法优化所述损失函数,使用pytorch的分布式数据并行算法训练所述EiRA模型,在训练集S上迭代设定个周期; S12、将所述待进行序列设计的蛋白质主链骨架三维坐标信息C输入训练好的EiRA模型中,得到输出的目标蛋白质的序列,该目标蛋白质的序列为设计结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410012 湖南省长沙市岳麓区麓山南路麓山门;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励