臻和(北京)生物科技有限公司;武汉臻和医学检验实验室有限公司;臻悦生物科技江苏有限公司范锐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉臻和(北京)生物科技有限公司;武汉臻和医学检验实验室有限公司;臻悦生物科技江苏有限公司申请的专利一种超高灵敏度的样本组分评估和溯源的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119517162B 。
龙图腾网通过国家知识产权局官网在2025-10-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510088279.1,技术领域涉及:G16B20/30;该发明授权一种超高灵敏度的样本组分评估和溯源的方法及装置是由范锐;苏振成;刘丹;杨飘;张亚晰;夏艳;黄宇;陈维之;杜波设计研发完成,并于2025-01-21向国家知识产权局提交的专利申请。
本一种超高灵敏度的样本组分评估和溯源的方法及装置在说明书摘要公布了:本发明公开了一种超高灵敏度的样本组分评估和溯源的方法及装置,所述方法包括:获取样本,进行核酸提取、文库构建、捕获富集和测序,生成测序数据;对测序数据进行预处理,得到高质量测序数据;识别高质量测序数据中存在的SNP位点及其基因型,构建SNP组合数据库;对SNP位点的双等位基因型进行定量统计,并计算次等位基因的变异丰度;根据SNP位点的基因型信息和等位基因变异丰度,构建SNP位点变异丰度背景分布模型;利用构建的SNP组合数据库和变异丰度背景分布模型,对样本进行交叉污染评估。本发明方法实现样本内多来源组分的定性评估、交叉污染比例的定量计算以及非自身来源的溯源分析。
本发明授权一种超高灵敏度的样本组分评估和溯源的方法及装置在权利要求书中公布了:1.一种超高灵敏度的样本组分评估和溯源的方法,其特征在于,包括以下步骤: S1、获取样本,通过实验室管理系统录入样本患者信息并分配样本编号,再进行核酸提取、文库构建、捕获富集和测序,生成测序数据; S2、对测序数据进行预处理,包括去除接头序列、低质量序列和单一碱基重复序列,得到高质量测序数据,并将测序读段回帖到参考基因组; S3、识别高质量测序数据中存在的SNP位点及其基因型,结合人群数据计算SNP位点次等位基因的人群频率,选择合适的SNP位点构建SNP组合数据库,记录每个检测样本的SNP组合基因型信息; S4、对SNP位点的双等位基因型进行定量统计,分别记录支持A等位基因型的数目和支持B等位基因型的数目,根据支持数目将等位基因型分为主等位基因和次等位基因,并计算次等位基因的变异丰度; S5、根据SNP位点的基因型信息和等位基因变异丰度,构建SNP位点变异丰度背景分布模型; S6、利用构建的所述SNP组合数据库和SNP位点变异丰度背景分布模型,对样本进行交叉污染评估,实现样本内多来源组分的定性评估、交叉污染比例的定量计算以及非自身来源的溯源分析; 所述S2中,对测序数据进行预处理,得到高质量测序数据,并将测序读段回帖到参考基因组,具体包括: 对测序数据进行接头拆分,拆分后的测序数据通常是fastq格式,包含读段名称、碱基序列、标识符号和碱基序列对应的测序质量值; 对拆分后的测序数据去除接头序列、低质量序列和单一碱基重复序列,得到高质量测序数据; 处理后的测序读段通过序列比对的方式回帖到参考基因组,形成bam格式文件; 所述S3中,选择合适的SNP位点构建SNP组合数据库,具体包括: 识别所述高质量测序数据覆盖范围内存在的SNP以及其基因型,基因型信息分为纯和野生型AA、杂合变异型AB、以及纯和变异型BB;结合人群数据,计算SNP位点次等位基因的人群频率,计算公式如下: 其中,Nhom为人群中纯和变异基因型的数目,Nhet为人群中杂合变异基因型的数目,N为人群总数目; 选择合适的SNP位点,其人群频率具备个体识别能力,候选位点应满足:位点深度不低于100;位点不位于HLA以及其他重复单元区间;位点等位基因频率应介于0.2-0.8;位点不存在两种以上人群频率大于1%的基因型; 对应n个SNP候选位点,计算其组合杂合率,得到一组具备个体识别能力的变异组合,组合杂合率应在0.4-0.6之间;计算组合杂合率公式如下: 其中,pi为第i个SNP位点的等位基因的人群频率; 构建数据库记录每个检测样本的SNP组合基因型信息,称为胚系库;将SNP位点的基因型信息编码为0,1,2,分别代表AA,AB和BB,缺失的基因型编码为-1,检测样本通过PID和SampleID进行标注; 所述S4-S5中,根据SNP位点的基因型信息和等位基因变异丰度,构建SNP位点变异丰度背景分布模型,具体包括: 对SNP位点的双等位基因型进行定量统计,其支持数目分别为CountA和CountB,根据支持数目将等位基因型分为主等位基因和次等位基因,次等位基因变异丰度通过如下方式计算: 在无对照样本的情况下,根据等位基因变异丰度进行统计检验,判定相应的基因型;基因型分为纯和类型和杂和类型,分别以0和1代表;次等位基因型通过如下方式推断: 通过人群数据和次等位基因型信息,对SNP集合进一步过滤,去掉次等位基因型为NA占比过高的位点;之后,对人群样本进行统计,去掉样本内NA占比过高的样本,剩余样本用于构建背景分布模型;每个位点以对应等位基因和基因型的组合,形成四组基线数据: Baseline1={freqm,1,freqm,2,...,freqm,n},whenGA=0 Baseline2={freqm,1,freqm,2,...,freqm,n},whenGA=1 Baseline3={freqm,1,freqm,2,...,freqm,n},whenGB=0 Baseline4={freqm,1,freqm,2,...,freqm,n},whenGB=1 其中,{freqm,1,freqm,2,...,freqm,n}为n个SNP位点的次等位基因变异丰度集合,G=0代表次等位基因为A且基因型为0的样本,G=1代表次等位基因为A且基因型为1的样本,G=0代表次等位基因为B且基因型为0的样本,GB=1代表次等位基因为B且基因型为1的样本;在此基础上拟合数据分布,选择最优拟合度的分布作为基线模型; 所述S6中,对样本进行交叉污染评估,具体包括: 通过计算样本中的次等位基因型为0的SNP位点比例,即纯和系数,判定样本有无发生交叉污染;如果纯和系数小于0.2,则样本为高污染样本;如果纯和系数大于等于0.2,次等位基因型为NA且次等位基因频率小于5%的SNP位点比例大于等于0.05,则样本为低污染样本; 基因型为NA的位点,即污染源特有位点;根据污染模式01、02、10,计算发生污染的预期频率freq01、freq02、freq10,通过计算的freq与污染预期频率的差值,使用最小二乘法计算得到污染比例θ; 污染比例θ和SNP位点的先验人群概率,得到污染模式01、02、10的后验概率,由此转为自身的胚系列表和污染源的胚系列表,分别匹配样本胚系库,根据匹配一致性得分进行溯源核查。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人臻和(北京)生物科技有限公司;武汉臻和医学检验实验室有限公司;臻悦生物科技江苏有限公司,其通讯地址为:100080 北京市海淀区宝盛南路1号院26号楼3层310号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励