中国科学院自动化研究所杜洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利基于深度学习的新靶点化合物活性预测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115331750B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211055546.8,技术领域涉及:G16C20/30;该发明授权基于深度学习的新靶点化合物活性预测方法及系统是由杜洋;田捷;主辉设计研发完成,并于2022-08-30向国家知识产权局提交的专利申请。
本基于深度学习的新靶点化合物活性预测方法及系统在说明书摘要公布了:本发明属于化合物活性预测领域,具体涉及了一种基于深度学习的新靶点化合物活性预测方法及系统,旨在解决新靶点活性化合物数据集中、数据量少、不平衡且相似度高,导致化合物活性预测结果准确性低的问题。本发明包括:从公开的文献、专利及数据库中提取数据,构建数据集;使用文献分割方法将数据集分割为训练集及测试集;将化合物转化为SMILES式;数据清洗及切片;基于深度神经网络构建并训练分子活性预测模型;利用训练好的模型对筛选集中的分子进行活性预测。本发明有效的降低了因全新靶点公开的活性化合物数据集样本量稀少、不平衡且相似所带来的种种偏差,提高了预测性能,实现了快速而准确的预测。
本发明授权基于深度学习的新靶点化合物活性预测方法及系统在权利要求书中公布了:1.一种基于深度学习的新靶点化合物活性预测方法,其特征在于,所述新靶点化合物活性预测方法包括: 步骤P10,将待筛选化合物分子转换为设定数量的SMILES式; 步骤P20,对SMILES式数据进行数据预处理,获得待筛选化合物的one-hot向量集; 步骤P30,构建并训练分子活性预测模型,基于所述待筛选化合物的one-hot向量集,通过训练好的分子活性预测模型进行待筛选化合物的活性预测; 其中,所述分子活性预测模型,其训练方法为: 步骤T10,获取文献中不高于设定阈值的相似活性化合物分子,全部的与活性化合物相似的非活性化合物分子以及设定数量的非相似化合物分子作为样本集; 步骤T20,通过文献分割方法将所述样本集划分为测试样本集和训练样本集; 步骤T30,将样本集每一个样本的分子转换为设定数量的SMILES式; 步骤T40,对于每一个SMILES式数据,进行数据预处理,获得预处理样本集; 步骤T50,基于深度神经网络构建分子活性预测模型,并基于所述预处理样本集进行模型的迭代训练,获得训练好的分子活性预测模型; 所述数据预处理,包括: 通过设定的字符取代SMILES式数据的独立的基团离子、手性原子及双字符元素,获得清洗数据; 通过设定长度的滑动窗口进行所述清洗数据的切片,将所述清洗数据切割为若干个设定长度的字符串片断; 将所述若干个设定长度的字符串片断中同组的片断保留一个、异组均出现的相同片断删除,获得合并删除后的片断集; 将所述合并删除后的片断集中每一个片断转换为one-hot向量,获得待筛选化合物的one-hot向量集,完成数据预处理操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。