中南大学李敏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中南大学申请的专利基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116504307B 。
龙图腾网通过国家知识产权局官网在2025-08-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310097309.6,技术领域涉及:G16B20/30;该发明授权基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法是由李敏;张富豪;武朝进设计研发完成,并于2023-02-10向国家知识产权局提交的专利申请。
本基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法在说明书摘要公布了:本发明公开了一种基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法、设备和介质,方法包括:提取蛋白质的生物理化特征及语义特征,使用多头注意力融合生物理化特征及语义特征,得到蛋白质各氨基酸的注意力向量;将注意力向量输入至预测模块,得到蛋白质与RNA的结合位点;其中,多头注意力和预测模块的参数预先优化方法为:根据蛋白质样本上的RNA结合位点和非结合位点的注意力向量之间的相似性构建第一损失函数,及根据蛋白质样本的预测准确性构建第二损失函数,然后基于两个损失函数和对多头注意力和预测模块的参数进行优化。本发明分类效果好、适用性强,且具有较强泛化能力,在蛋白质与RNA结合位点预测问题上取得显著效果。
本发明授权基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法在权利要求书中公布了:1.一种基于对比学习和注意力机制的蛋白质与RNA结合位点预测方法,其特征在于,包括: 提取蛋白质的生物理化特征及其序列的语义特征; 使用多头注意力融合蛋白质的生物理化特征及其序列的语义特征,得到蛋白质各氨基酸的注意力向量; 将注意力向量输入至预测模块,输出得到蛋白质与RNA的结合位点; 其中,多头注意力和预测模块的参数预先优化方法为:根据蛋白质样本上的RNA结合位点和非结合位点的注意力向量之间的相似性构建第一损失函数,以及根据蛋白质样本的预测准确性构建第二损失函数,然后基于蛋白质样本的第一和第二损失函数值之和对多头注意力和预测模块的参数进行优化; 第一损失函数的构建方法为: 先将氨基酸的注意力向量Ki输入至两层的MLP,输出得到氨基酸的隐特征向量zi;其中两层的MLP之间添加有ReLU函数; 再根据所有蛋白质样本中所有氨基酸的隐特征向量,构建第一损失函数为: 式中,Lc为第一损失函数值,I为所有蛋白质样本中所有氨基酸构成的样本集合,i为样本集合I中的氨基酸样本,Pi是正样本集合,Ai是除样本i以外的其他样本的集合,zi是样本i的隐特征向量,zp是和样本i属于同类的氨基酸的隐特征向量,za是与样本i不属于同类的氨基酸的隐特征向量;τ是温度系数,调节对困难负样本的关注程度;其中,氨基酸按是否为与RNA的结合位点分为两类,和RNA结合的氨基酸是正样本,不和RNA结合的氨基酸是负样本; 构建的第二损失函数方法为: 式中,N是所有蛋白质样本中所有氨基酸构成的样本集合I中的氨基酸样本个数,yi是氨基酸样本i的标签,1表示是结合位点,0表示非结合位点;pi是预测模型根据输入的注意力向量Ki预测得到的结合倾向性,其值范围是[0,1];α是调节样本不平衡的因子,r是调节难易分类样本的因子。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中南大学,其通讯地址为:410083 湖南省长沙市岳麓区麓山南路932号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。