安徽农业大学窦欣雨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽农业大学申请的专利一种基于集成学习的RNA中2OM位点预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207581B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411248190.9,技术领域涉及:G16B40/00;该发明授权一种基于集成学习的RNA中2OM位点预测方法是由窦欣雨;彭伟;赵子涵;魏卓宇;祝小雷设计研发完成,并于2024-09-06向国家知识产权局提交的专利申请。
本一种基于集成学习的RNA中2OM位点预测方法在说明书摘要公布了:本发明公开了一种基于集成学习的RNA中2OM位点预测方法,属于生物信息学技术领域。本发明针对RNA序列特性,对Promoter‑BERT模型进行特定任务的微调,使其能够更有效地捕捉特定任务中RNA序列的复杂模式,从而获取高质量的生物学特征表示;采用ANOVA技术对提取的特征进行选择,剔除冗余特征,保留最具影响力的特征,此外,结合传统的序列特征与通过Word2Vec模型得到的嵌入特征,以增强模型的表达能力;结合轻量级梯度提升机与深度学习模型的预测结果,通过软投票机制形成最终的预测模型,这种集成方法不仅提高了模型的泛化能力,还增加了预测的稳定性。
本发明授权一种基于集成学习的RNA中2OM位点预测方法在权利要求书中公布了:1.一种基于集成学习的RNA中2OM位点预测方法,其特征在于,包括以下步骤: S1:数据准备 从公共数据库中收集2OM位点数据,按设定比例随机划分为训练集和测试集; S2:特征学习 利用K-mer、ANF、NCP从RNA序列中提取三种手工设计的特征,并采用Word2Vec模型对RNA序列进行向量化处理,得到Word2Vec嵌入特征;利用ANOVA技术从手工设计的特征中选择与2OM位点预测高度相关的特征子集,并与由Word2Vec模型生成的嵌入特征结合; 在所述步骤S2中,三种手工设计的特征分别为核苷酸组成K-mer、核苷酸化合物特性NCP、自动相关性特性ANF;其中,核苷酸组成K-mer用于计算连续k个核苷酸的频率,以提取RNA序列的短程信息,所述核苷酸化合物特性NCP用于利用向量编码1,1,1、0,0,1、0,1,0和1,0,0分别表示A、U、C和G,所述自动相关性特性ANF用于描述RNA序列中核苷酸的分布和其在序列中的位置相关性,通过计算从序列起始到位置i的每个核苷酸的累积出现频率di来实现; S3:模型建立 基于3mer和5mer分词得到不同长度的序列单元的文本,即分割的序列,将分割的序列被输入到预训练的Promoter-BERT模型中进行微调,获得了两个微调模型;基于得到的特征子集,使用轻量级梯度提升机构建基础模型,并将其与通过预训练的Promoter-BERT模型微调得到的模型进行集成,通过软投票机制整合各基础模型的预测概率,形成最终的集成模型2OMPro,其中通过预训练的Promoter-BERT模型微调得到的模型也即基础模型; S4:优化与评估 利用交叉验证和独立测试集评估集成模型2OMPro的性能; S5:部署与预测 将集成模型2OMPro部署在实际的生物医学研究工作中,对未知的2OM位点进行预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽农业大学,其通讯地址为:230031 安徽省合肥市长江西路130号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。