中国人民解放军军事科学院军事医学研究院陈涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军军事科学院军事医学研究院申请的专利一种基于肽语言模型的苦肽预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117153246B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310901746.9,技术领域涉及:G16B20/00;该发明授权一种基于肽语言模型的苦肽预测方法是由陈涛;朱云平;徐小放;韩明飞;陈洨清设计研发完成,并于2023-07-21向国家知识产权局提交的专利申请。
本一种基于肽语言模型的苦肽预测方法在说明书摘要公布了:本发明公开了一种基于肽语言模型的苦肽预测方法,其步骤包括:1选取多条蛋白质序列作为原始语料;将所选蛋白质序列分为两个子集,针对第一子集中的每条蛋白质序列进行酶切得到多个肽段序列;对第二子集中的每条蛋白质序列随机分割得到多个氨基酸序列;然后将所得序列生成由Token表示的肽段序列;2利用Token表示的肽段序列训练ALBERT模型,得到肽段语言模型;利用Text‑CNN构建微调层并对其进行训练;3对目标肽段的Token表示输入肽段语言模型得到该目标肽段的向量化表示;4利用训练后的微调层对该目标肽段的向量化表示进行卷积,并将卷积结果进行拼接后通过Softmax层输出该目标肽段为苦肽的概率。
本发明授权一种基于肽语言模型的苦肽预测方法在权利要求书中公布了:1.一种基于肽语言模型的苦肽预测方法,其步骤包括: 1选取多条蛋白质序列作为原始语料;将所选蛋白质序列分为两个子集,针对第一子集中的每条蛋白质序列,随机选取一种可行的酶切方式进行酶切得到多个肽段序列;对第二子集中的每条蛋白质序列随机分割得到多个氨基酸序列;然后对所得各肽段序列、氨基酸序列进行分词,并将分词所得氨基酸词汇更替为Token表示,得到由Token表示的肽段序列; 2将每一Token表示的肽段序列作为一个句子,将分词所得的氨基酸组合作为词汇,训练ALBERT模型;将训练后的ALBERT模型作为肽段语言模型;利用Text-CNN构建微调层,对苦肽样本进行分词并将分词所得氨基酸词汇更替为Token表示,得到由Token表示的苦肽样本输入所述肽段语言模型,得到该苦肽样本的向量化表示对所述微调层进行训练; 3对目标肽段分词并将分词所得氨基酸词汇更替为Token表示,得到由Token表示的目标肽段输入所述肽段语言模型,得到该目标肽段的向量化表示; 4利用训练后的微调层对该目标肽段的向量化表示进行卷积,并将卷积结果进行拼接后通过Softmax层输出该目标肽段为苦肽的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军军事科学院军事医学研究院,其通讯地址为:100850 北京市海淀区太平路27号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。