Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 安庆师范大学张步忠获国家专利权

安庆师范大学张步忠获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉安庆师范大学申请的专利一种基于混合深度学习策略的BCE预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119993274B

龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510055199.6,技术领域涉及:G16B30/10;该发明授权一种基于混合深度学习策略的BCE预测方法是由张步忠;姚昭伦;童岳敏;徐亚军设计研发完成,并于2025-01-14向国家知识产权局提交的专利申请。

一种基于混合深度学习策略的BCE预测方法在说明书摘要公布了:本发明涉免疫药物研发技术领域,公开了一种基于混合深度学习策略的BCE预测方法,包括如下步骤:步骤1、构建BCE预测模型;步骤2、向所述BCE预测模型输入蛋白序列;步骤3、利用预测模型输出该蛋白序列是否为BCE的结果。所述步骤1中的BCE预测模型包括数据库、特征提取模块、特征处理模块以及前向神经网络模块;其中:数据库用于训练数据集的获取;特征提取模块用于对数据进行特征提取并获取四组特征;特征处理模块用于对提取的特征进行处理。本发明提出的深度学习预测方法,用序列特征和结构特征表示一条蛋白质,用四通道深度神经网络,分别提取序列信息和结构信息,可用同一个模型预测线性表位。

本发明授权一种基于混合深度学习策略的BCE预测方法在权利要求书中公布了:1.一种基于混合深度学习策略的BCE预测方法,其特征在于,包括如下步骤: 步骤1、构建BCE预测模型; 步骤2、向所述BCE预测模型输入蛋白序列; 步骤3、利用预测模型输出该蛋白序列是否为BCE的结果; 所述步骤1中的BCE预测模型包括数据库、特征提取模块、特征处理模块以及前向神经网络模块; 其中: 数据库用于训练数据集的获取; 特征提取模块用于对数据进行特征提取并获取四组特征; 特征处理模块用于对提取的特征进行处理; 前向神经网络模块用于合并经处理后的多个特征并输出预测值; 所述特征提取模块用于提取ProtT5表示特征、ESM-2表示特征、DSSP特征以及序列特征,序列特征由序列残基正交编码、AAT、AAP、AAC进行拼接; 其中: AAP为氨基酸抗原对、AAT为氨基酸三聚体、AAC为氨基酸组成; ProtT5表示特征利用蛋白语言大模型ProtT5提取;具体模型为ProtT5-XL-UniRef50,该模型的输入为蛋白质的一级序列,输出为对应序列中第m个残基的特征表示向量,的维度1024; ESM-2表示特征利用蛋白语言预训练大模型ESM-2提取;具体模型为Esm2_t33_650M_UR50D,该模型的输入为蛋白质的一级序列,输出为对应序列中第m个残基的特征表示向量,的维度1280; DSSP特征利用蛋白质结构预测大模型ESMFold提取;使用ESMFold预测蛋白质的三维结构,使用DSSP软件解析蛋白质文件,得到蛋白质八状态的二级结构信息、()二面角信息、溶剂可及表面积信息;二级结构用8维的独热正交编码数据表示;一个二面角用一对正弦余弦函数表示,如公式(1),()二面角用4维数据表示;溶剂可及表面积用最大-最小归一化,如公式(2),残基溶剂可及表面积最小值为0;上述数据共13维; (1) (2) 序列特征采用如下方法提取; 鉴于上述的独热正交向量编码中非零数据过少: 首先利用公式(3)将自编码器稀疏编码映射到稠密编码;取编码器中参数W为对应的新编码向量,数据维度20维; (3) AAP特征表示数据集中,AAP表位序列中相邻的两个氨基酸成对出现的频率与非表位序列中该AAP的出现频率的比率,计算如公式(4),按照公式,归一化到[-1,1];氨基酸抗原对特征用AAP特征值、AAP中最大值、AAP中最小值和AAP平均值四个值表示,共4维; (4) 其中和计算方式如公式(5)和(6); (5) 其中,是表位序列中一对氨基酸出现的次数,为表位序列中所有氨基酸对的数量; (6) 其中,是非表位序列中一对氨基酸对出现的次数,是非表位序列中所有氨基酸对的数量; AAT特征表示数据集中表位序列中,连续三个氨基酸残基的出现频率与非表位序列中该三聚体的出现频率的比率,计算方式和归一化方式同AAP特征,AAT特征表示包括该残基的AAT特征值、最大值、最小值和平均值4组值,共4维; AAC特征,表示数据集中每条蛋白质序列中每个氨基酸的相对比例,计算方式如公式(7); (7) 其中是该序列中类型氨基酸的数量,是序列长度,AAC特征1维; 考虑到深度学习模型训练时数据批次输入方便,根据所有测试集中的最长序列将所有序列长度对齐到71,小于71的补零; 残基特征ProtT5为71*1024,ESM-2为71*1280,DSSP为71*13,残基编码、AAT、AAP、AAC拼接起来共71*29。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安庆师范大学,其通讯地址为:246002 安徽省安庆市菱湖南路128号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。