安徽大学田野获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉安徽大学申请的专利基于超大规模进化算法和硬件加速的蛋白质异常检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114298214B 。
龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111613042.9,技术领域涉及:G06F18/24;该发明授权基于超大规模进化算法和硬件加速的蛋白质异常检测方法是由田野;孟源;张亚杰;张兴义设计研发完成,并于2021-12-27向国家知识产权局提交的专利申请。
本基于超大规模进化算法和硬件加速的蛋白质异常检测方法在说明书摘要公布了:本发明公开了一种基于超大规模进化算法和硬件加速的蛋白质异常检测方法,包括:1、采集质谱特征数据;2、生成质谱特征选择方案种群和外部存档,并设置参数;3、更新外部存档并对质谱特征进行快速聚类分组;4、执行交配池选择后,同时在原始空间和分组后的缩减空间生成子代质谱特征选择方案;5、利用子代特征选择方案自适应调节算法参数,之后合并子代和父代质谱特征选择方案种群进行环境选择,迭代以上过程选取优质特征选择方案,最终得到最优的蛋白质异常检测特征选择方案。本发明能高效地处理超大规模蛋白质异常检测问题,在超大规模的质谱特征集中快速的获得优质特征选择方案并进行蛋白质异常检测,以提高检测准确性。
本发明授权基于超大规模进化算法和硬件加速的蛋白质异常检测方法在权利要求书中公布了:1.一种基于超大规模进化算法和硬件加速的蛋白质异常检测方法,其特征是按如下步骤进行: 步骤一、使用SELDI方法获得血清的X×D维的质谱特征集F,用于表征血清中给定质量值的蛋白质的丰度,其中,X表示样本数,D表示每个样本所对应的质谱特征数; 步骤二、设定种群大小为N,定义种群集合记为P={p1,p2,…,pi,…,pN},pi表示种群中第i个个体,且每个个体代表从D个质谱特征中选择不同质谱特征所构成的质谱特征选择方案,且pi={pi1,pi2,…,pij,…,piD},pij表示第i个个体pi的第j个质谱特征是否选入质谱特征选择方案中,若pij=1,则代表选入,若pij=0,则代表未选入;j∈[1,D];将种群P中个体所在的搜索空间定义为原始空间,且所述原始空间的维度为D; 步骤2.1、计算每个质谱特征的分数,作为蛋白质异常检测的重要程度; 步骤2.1.1、在原始空间中生成D个质谱特征选择方案的集合Q={q1,q2,…,qk,…,qD},qk表示集合Q中第k个个体,且qk={qk1,qk2,…,qkj,…,qkD},qkj表示第k个个体qk的第j个质谱特征是否选入质谱特征选择方案中,且qk中仅有第k个质谱特征被选入,即qkk=1,其余qkj=0,k≠j; 步骤2.1.2、利用式1计算第k个个体qk的分类错误率指标errorqk: errorqk=ENqkX1 式1中,ENqk表示使用第k个个体qk所代表的质谱特征选择方案时分类错误的样本数,将第k个个体qk所代表的质谱特征选择方案中所选入的质谱特征数记为numqk; 步骤2.1.3、利用集合Q中每个个体的错误率和所选入的质谱特征数对所有个体进行非支配排序,并将个体所在的前沿编号作为个体的分数,记为Score={score1,score2,…,scorek,…,scoreD},其中,scorek表示第k个个体qk的分数,即第k个质谱特征的重要性; 步骤2.2、初始化; 步骤2.2.1、定义并初始化迭代次数t=1,第t代在原始空间中产生子代的概率为ρt,第t代的分组数为Kt,最大迭代次数为T;初始化质谱特征选择方案的外部存档At为空集;外部存档At的预设值为NA; 步骤2.2.2、初始化第t代种群其中,表示第t代种群Pt的第i个个体,即第i个质谱特征选择方案,且初始化每个个体的长度为D的全0向量; 步骤2.2.3、初始化i=1; 步骤2.2.4、生成第i个随机数randi; 步骤2.2.5、从第i个个体中随机选择两个质谱特征,并将所选择的两个质谱特征的索引分别记为m、n,令表示第i个个体中第m个质谱特征是否选入,表示第i个个体中第n个质谱特征是否选入;若scorem<scoren,则令表示将质谱特征选择方案个体中第m个质谱特征选入,否则,令表示将特征选择方案个体中第n个质谱特征选入; 步骤2.2.6、重复执行randi×D次步骤2.2.5,从而得到更新后的第i个个体并赋值给 步骤2.2.6、将i+1赋值给i后,判断i>N是否成立,若成立,则表示得到更新后的第t代种群并赋值给Pt后作为初始种群;否则,返回步骤2.2.4执行; 步骤三、更新外部存档At并对质谱特征进行快速聚类分组; 步骤3.1、将第t代种群Pt和外部存档At合并,并对合并后的第t代集合进行非支配排序,将排序后的第一个子集赋值给外部存档At; 若赋值后的外部存档At中的质谱特征选择方案的数量超过NA,则计算At中质谱特征选择方案的拥挤距离,删除At中拥挤距离最小的质谱特征方案直至At中质谱特征方案的数量不超过NA为止,从而得到更新后的外部存档并赋值给At; 步骤3.2、根据外部存档At和第t代的分组数Kt对原始空间中的质谱特征进行聚类; 步骤3.2.1、从At中获取所有的质谱特征选择方案记为集合且表示At中第j个质谱特征在不同个体中被选入的情况向量,其中|At|表示At中质谱特征选择方案的数目,表示第j个质谱特征在At中的第a个体中是否被选中,若则表示选入,若则表示未选入;a∈[1,|At|]; 利用式2获得第j个质谱特征在不同个体中被选入的情况向量的稀疏度从而得到第t代的稀疏度Sparsityt; 式2中,表示情况向量中元素为1的数目; 步骤3.2.2、将所有质谱特征选入的情况向量的稀疏度最接近0.5的质谱特征作为参考质谱特征,将所述参考质谱特征索引记为c,利用式3计算第b个质谱特征与参考质谱特征之间的相似度从而按照相似度对所有质谱特征进行排序得到第t代的相似度排名rankt; 式3中,表示At中第b个质谱特征未选入且所述参考质谱特征选入的特征选择方案的数目;表示At中第b个质谱特征选入且所述参考质谱特征未选入的特征选择方案的数目;表示At中第b个质谱特征选入且所述参考质谱特征选入的特征选择方案的数目; 步骤3.2.4、将稀疏度Sparsityt中值为1的质谱特征选入情况向量放入同一组值为0的质谱特征选入情况向量放入从rankt中去除和所对应的质谱特征后,得到新的相似度排名并赋值给rankt; 将rankt中的质谱特征平均分成Kt-2组,从而得到分组后的质谱特征的索引集,记为其中,表示第g组质谱特征的索引集,g∈[3,Kt],其中分别表示中第一个质谱特征和最后一个质谱特征的索引,lt=[|rankt|Kt-2]表示分组的大小;|rankt|表示相似度排名rankt的长度; 步骤四、执行交配池选择后,同时在分组后的缩减空间和原始空间中生成子代质谱特征选择方案; 步骤4.1、对第t代种群Pt进行非支配排序和拥挤距离计算,再按照排名和拥挤距离使用二元锦标赛法从种群Pt中选择2N个质谱特征选择方案并作为第t代父代集合P′t,且其中,为第t代父代集合P′t中第s个质谱特征选择方案;s∈[1,2N]; 步骤4.2、生成长度为2N的随机向量rand={r1,r2,…,rs,…,r2N},其中,rs表示第s个随机数; 定义并初始化划分向量indext为长度2N的全0向量;且 其中,表示第t代父代集合P′t中第s个质谱特征选择方案为作为原始空间中生成子代的父代个体或者缩减空间中生成子代的父代个体; 若rs<ρt,则令否则,令从而得到更新后的划分向量并赋值给indext,其中,表示第t代父代集合P′t中第s个质谱特征选择方案为原始空间中生成子代的父代个体,表示质谱特征选择方案为缩减空间中生成子代的父代个体; 步骤4.3、根据划分向量indext将第t代父代集合P′t中原始空间生成子代的父代个体子集记为PBt,且其中,表示原始空间生成子代的父代个体子集PBt中第e个质谱特征选择方案,且 表示第e个质谱特征选择方案中的第j个质谱特征是否被选入;|PBt|为原始空间生成子代的父代数量,e∈[1,|PBt|]; 根据划分向量indext将父代集合P′t中缩减空间生成子代的父代个体子集记为PB′t,且其中,表示缩减空间生成子代的父代个体子集PB′t中第f个质谱特征选择方案,且 表示第f个质谱特征选择方案中第j个质谱特征是否被选入;|PB′t|为缩减空间生成子代的父代数量,f∈[1,|PB′t|]; 步骤4.4、根据分组后的质谱特征的索引集Groupt,将PB′t中个体映射至Kt维的缩减空间中,并将分组Groupt中每个组对应的质谱特征均视作一个维度,从而将原始空间中D维的个体映射到缩减空间中变为Kt维的个体; 利用式4计算原始空间中第f个个体的第g个分组对应的质谱特征选入情况在缩减空间中第g位的取值为1的概率 式4中,表示第t代第g个分组中索引数量; 生成维度为|PB′t|×Kt的随机矩阵rand′,若则令缩减空间中父代集合PB*t中第f个个体的第g位取值为1,否则,令第g位的取值为0,从而得到原始空间映射到缩减空间中的父代集合PB*t;其中,rand′fg表示rand′中第f个随机向量的第g个随机数; 步骤4.5、基于原始空间中的父代集合PBt生成原始空间中的子代集合OBt; 步骤4.5.1、初始化子代集合OBt为空集; 步骤4.5.2、从原始空间的父代个体子集PBt中随机选择两个个体作为父代ut和父代vt,且 表示第j个质谱特征是否被选入,表示选入,表示不选入; 表示第j个质谱特征是否被选入; 初始化子代个体o为父代u; 步骤4.5.3、生成随机数rand″1,若rand″1<0.5,则从父代u中所选入的质谱特征且父代v中未选入的质谱特征中随机选择两个质谱特征,并比较两个质谱特征的分数,将分数更大的质谱特征在子代个体o中对应的质谱特征设定为未选入;否则,从父代u中选入的质谱特征且父代v所选入的质谱特征中随机选择两个质谱特征,并比较两个质谱特征分数,将分数更小的质谱特征在子代个体o中对应的质谱特征设定为选入; 步骤4.5.4、生成随机数rand″2,若rand″2<0.5,从子代o选入的质谱特征中随机选择两个质谱特征,并比较两个质谱特征分数,将子代个体o中分数更大的质谱特征设定为未选入;否则,从子代个体o未选入的质谱特征中随机选择两个质谱特征,比较两个质谱特征对分数,将子代个体o中分数更小的质谱特征设定为选入;从而将子代个体o加入到子代集合OBt中; 步骤4.5.5、从父代集合PBt中删除父代u和父代v后,若父代集合PBt不为空,则返回步骤4.5.2执行,否则,表示得到原始空间中的第t代子代集合OBt; 步骤4.6、对缩减空间中的父代集合PB*t使用单点交叉和逐位突变得到缩减空间中的子代集合其中,表示子代集合OB*t中第h个个体,且 表示第t代子代集合OB*t中第h个个体在缩减空间第g位;|OB*t|表示子代集合OB*t中个体的数量; 步骤4.7、将子代个体映射到原始空间中的子代记作 表示特征选择方案中第j个质谱特征是否选入;若原始空间中第j个质谱特征属于第g个分组则将缩减空间中子代个体的第g位赋值给从而得到缩减空间映射到原始空间的子代集合 表示子代集合OB′t中第h个个体,|OB′t|表示子代集合OB′t中个体的数量,且|OB*t|=|OB′t|; 步骤4.8、将原始空间子代集合OBt和缩减空间映射到原始空间的子代集合OB′t的并集作为第t代子代种群Ot,令第t代子代种群Ot的规模为N; 步骤五、利用第t代子代种群Ot的自适应调节所述分组数量Kt和概率ρt,将第t代子代种群Ot与第t代种群Pt合并后进行环境选择; 步骤5.1、利用式5和式6分别计算第t+1代质谱特征分组数Kt+1以及第t+1代的概率ρt+1: 式5中,s1,t表示第t代种群Pt在缩减空间里生成子代的数量,ns1,t表示第t代种群Pt在缩减空间里生成的子代中非支配解的数量,s1,t-1表示第t-1代种群Pt-1在缩减空间里生成子代的数量,ns1,t-1表示第t-1代种群Pt-1在缩减空间里生成的子代中非支配解的数量;当t=1时,将初始种群赋值给第t-1代种群Pt-1; 式6中,s2,t表示第t代种群Pt在原始空间里生成子代的数量,ns2,t表示第t代种群Pt在原始空间里生成的子代中非支配解的数量; 步骤5.2、合并第t代种群Pt和子代种群Ot,并对合并后的2N个个体去重后执行非支配排序和拥挤距离计算,从而选取排序后前N个个体作为第t+1代种群并赋值给Pt; 步骤5.3、将t+1赋值给t后,判断t>T是否成立,若成立,则输出最优特征选择方案种群Pt,并将所述最优特征选择方案种群Pt中所选入的质谱特征作为血清中蛋白质是否异常的检测依据;否则返回步骤三顺序执行。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经开区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。