上海交通大学马步勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海交通大学申请的专利病毒进化趋势预测方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117174163B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311102542.5,技术领域涉及:G16B15/30;该发明授权病毒进化趋势预测方法和系统是由马步勇;曾鑫成;邱毓淞;宁振宇;张凌昊;李香逸;吕利君;董若冰;许晗琳;王艳菁设计研发完成,并于2023-08-29向国家知识产权局提交的专利申请。
本病毒进化趋势预测方法和系统在说明书摘要公布了:本发明提供了一种病毒进化趋势预测方法和系统,包括:获取有基于深度突变扫描的亲和力标注的病毒蛋白‑靶点蛋白对,划分为训练集、验证集和测试集;搭建数据编码器,对蛋白质语言模型进行数据编码;对数据编码器中的蛋白质语言模型在下游任务上进行逐层参数训练;在训练集和验证集上对预测亲和力和实验亲和力两个指标以相关系数R2进行评价,选出最优模型,最终在测试集上进行预测验证;计算基于结构的免疫逃逸分数和基于语言模型的免疫逃逸分数;进行病毒适应性计算以及遗传变异的多轮迭代,筛选出潜在的预设高风险毒株。本发明能够从分子层面揭示病毒的进化模式,有效模拟病毒的突变规律并预判流行趋势的效果。
本发明授权病毒进化趋势预测方法和系统在权利要求书中公布了:1.一种病毒进化趋势预测方法,其特征在于,包括: 步骤1:在病毒数据库中获取有基于深度突变扫描的亲和力标注的病毒蛋白-靶点蛋白对,并划分为训练集、验证集和测试集,收集与不同病毒蛋白对应的抗体抗原复合物结构数据; 步骤2:搭建数据编码器,对蛋白质语言模型进行数据编码; 步骤3:对数据编码器中的蛋白质语言模型在下游任务上进行逐层参数训练; 下游任务指将经过数据编码器提取到的代表蛋白质氨基酸序列信息的1280长度的特征向量,通过一个三层卷积神经网络将每个序列的特征向量转化为其对应的亲和力预测值,在三层卷积神经网络中,每一层卷积层使用一个大小为3的卷积核学习同一序列中相邻氨基酸特征之间的关系,然后通过512个神经元的全连接层将结果输出为实验分析需要的亲和力数值; 步骤4:在训练集和验证集上对预测亲和力和实验亲和力两个指标以相关系数R2进行评价,选出最优模型,最终在测试集上进行预测验证; 步骤5:计算基于结构的免疫逃逸分数和基于语言模型的免疫逃逸分数; 步骤6:进行病毒适应性计算以及遗传变异的多轮迭代,筛选出潜在的预设高风险毒株; 所述步骤5包括: 基于结构的免疫逃逸分数根据抗体的识别位点,建立针对病毒的免疫逃逸预测模型,并以抗体识别的频率高低设计四个等级,分别采取不同权重,通过计算输入的病毒氨基酸突变情况来计算免疫逃逸分数ΔE,表达式为: 其中:Nmut表示突变位点的总数目;i表示每一个突变位点;wi表示每个突变位点对应的权重; 基于结构的免疫逃逸分数使用蛋白质语言模型计算病毒抗原整体相对于原来的病毒发生的语义变化,在算法中计算每一种新的突变株相对于原始毒株的蛋白质语言变化,然后计算该变化的L-1范数作为基于语言模型的免疫逃逸分数ΔZ,在数值缩放策略上,经过参数优化调整,将该值除以100来使用,表达式为: 其中:Z表示抗原的蛋白质嵌入向量;Zref表示野生型抗原的蛋白质嵌入向量;Sz表示缩放参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。