安徽农业大学陈敏瑜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽农业大学申请的专利一种基于多模态特征和孪生网络的神经肽预测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118629516B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410614904.7,技术领域涉及:G16B40/20;该发明授权一种基于多模态特征和孪生网络的神经肽预测方法及系统是由陈敏瑜;文戬;沈永祺;祝小雷设计研发完成,并于2024-05-17向国家知识产权局提交的专利申请。
本一种基于多模态特征和孪生网络的神经肽预测方法及系统在说明书摘要公布了:本发明公开了一种基于多模态特征和孪生网络的神经肽预测方法及系统,属于神经肽预测技术领域,包括以下步骤:S1:构建基准数据集;S2:NPs编码;S3:孪生网络模块构建;S4:蛋白质语言模块构建;S5:构建预测模型;S6:利用模型进行预测。本发明构建了一个平衡的数据集,在此数据集的基础上,利用四种编码方式令牌嵌入编码、word2vec嵌入编码、手工特征编码、蛋白质语言嵌入编码得到神经肽序列的特征向量,利用孪生网络模块和蛋白质语言模块结合构建预测模型,能够对神经肽NPs进行准确识别,精度超过目前已有的预测方法。
本发明授权一种基于多模态特征和孪生网络的神经肽预测方法及系统在权利要求书中公布了:1.一种基于多模态特征和孪生网络的神经肽预测方法,其特征在于,包括以下步骤: S1:构建基准数据集 建立基准数据集,将基准数据集划分为训练集与测试集; 在所述步骤S1中,基准数据集的生成过程如下: S11:通过NeuroPep2.0和UniProt数据库获得神经肽序列信息; S12:筛选保留了由5~100个残基组成的神经肽; S13:使用CD-HIT消除冗余序列,最后获得了4463个神经肽和4463个非神经肽; S14:将数据集按9:1的比例分为训练集和测试集; S15:将训练集划分进行10次10折交叉验证,最终得到基准数据集; S2:NPs编码 利用令牌嵌入编码、word2vec嵌入编码、手工特征编码、蛋白质语言嵌入编码四种编码方式将基准数据集的神经肽序列编码为特征向量; 在所述步骤S2中,蛋白质语言嵌入编码的具体处理过程如下: S231:选择预先训练的ProtT5蛋白质语言模型,即ProtT5-XL-UniRef50,提取神经肽的上下文语义信息,以生成肽序列和二级结构序列的嵌入表示; S232:选择ProtT5蛋白质语言模型中最后一层的平均嵌入特征作为最终嵌入特征; 在所述步骤S231中,通过PHATweb服务器来获取神经肽的二级结构序列; 在所述步骤S2中,为了从原始序列中提取出全面的理化信息,手工特征编码采用了以下12种人工编码策略:AAC、DPC、CTriad、GAAC、GDPC、GTPC、SE、CTDC、CTDT、CTDD、Moran以及SOCN; S3:孪生网络模块构建 通过变压器编码器、MS-CNN、Bi-GRU构建孪生网络模块,将令牌嵌入、word2vec嵌入的向量结果作为输入,并将结果输入FC层; S4:蛋白质语言模块构建 通过另外的Bi-GRU构建蛋白质语言模块,将得到的手工特征和蛋白质语言嵌入特征融合输入到蛋白质语言模块的Bi-GRU单元中,得到神经肽的特征表示,并将结果输入FC层; S5:构建预测模型 结合孪生网络模块和蛋白质语言模块,基于步骤S2中的特征向量进行训练,建立预测模型; S6:利用模型进行预测 利用步骤S5中的预测模型对测试集的神经肽序列进行预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽农业大学,其通讯地址为:230031 安徽省合肥市长江西路130号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励