天津大学四川创新研究院李国良获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学四川创新研究院申请的专利一种基于特征向量的高性能基因匹配判别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115410651B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211034348.3,技术领域涉及:G16B30/20;该发明授权一种基于特征向量的高性能基因匹配判别方法及系统是由李国良;江熠;谢宇涛;张也;彭德华;刘原驰;陈建邦;唐善雯;章璐;于鑫慧设计研发完成,并于2022-08-26向国家知识产权局提交的专利申请。
本一种基于特征向量的高性能基因匹配判别方法及系统在说明书摘要公布了:本发明公开了一种基于特征向量的高性能基因匹配判别方法及系统,该方法包括如下步骤:S1:CPU多线程基因解析,获得基因数据reads的ID、碱基序列和序列长度,并传回GPU;S2:GPU计算每条基因数据reads片段的质心值;S3:评价碱基序列相似性;S4:训练DNN模型:将输入向量x送至DNN网络的输入层,进行前向传播,经过若干隐层后得到前向输出y';S5:计算y'与真实值y之间的误差,并调整DNN网络的各个连接权值;S6:完成DNN模型的训练后,利用训练好的DNN模型识别基因数据reads之间的匹配关系,由此获得每条基因数据reads间的相似性关系。本发明大幅提高了生物信息学分析流程的速度,有助于生信分析人员以更快的速度、更短的时间获得准确的分析结果。
本发明授权一种基于特征向量的高性能基因匹配判别方法及系统在权利要求书中公布了:1.一种基于特征向量的高性能基因匹配判别方法,其特征在于,包括如下步骤: S1:CPU多线程基因解析,获得基因数据reads的ID、碱基序列和序列长度,并传回GPU;步骤S1具体包括:CPU通过内置RAID卡或NFS协议或者直接读取基因测序数据文件的方式,多线程并行计算基因解析获得基因数据reads序列的ID、碱基序列和序列长度,并从不同位置开始读取碱基序列,即:将每条基因数据reads头尾剪裁各n和m个碱基,得到首尾各去n个和首尾各去m个的基因数据reads片段,并将基因数据reads片段及对应ID编号传回给GPU; S2:GPU计算每条基因数据reads片段的质心值;步骤S2具体包括:使用异步操作,当GPU接收到基因数据reads片段时,立即启动核函数,而无需等待全部数据回传完毕,通过基因数值化表达算法,计算每个基因数据reads片段的质心特征值,其中,一条基因数据reads共有四个质心值; S3:随机选择两条碱基序列进行匹配对齐,并对匹配结果进行打分,以此评价碱基序列相似性; S4:将两条碱基序列的两组质心值及其序列长度通过线性特征比例变换至[-1,1]以内,作为数据集的输入向量x; S5:将两条碱基序列匹配对齐的结果输出,作为数据集的输出向量; S6:训练DNN模型:将输入向量x送至DNN网络的输入层,进行前向传播,经过若干隐层后得到前向输出y'; S7:计算y'与真实值y之间的误差,并调整DNN网络的各个连接权值; S8:完成DNN模型的训练后,利用训练好的DNN模型识别基因数据reads之间的匹配关系,由此获得每条基因数据reads间的相似性关系;步骤S8具体包括:不断循环步骤S7调整权值的过程,直到训练误差收敛到极小值,即得到符合要求的DNN网络权重,并利用训练好的DNN模型识别基因数据reads之间的匹配关系,由此获得每条基因数据reads间的相似性关系。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学四川创新研究院,其通讯地址为:610000 四川省成都市天府新经济产业园B6号楼13层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。