西安交通大学叶凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安交通大学申请的专利一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119763663B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411892711.4,技术领域涉及:G16B30/10;该发明授权一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质是由叶凯;陈先润;王松渤设计研发完成,并于2024-12-20向国家知识产权局提交的专利申请。
本一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质在说明书摘要公布了:本发明公开了一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质,对待检测的三代测序数据中的单个样本分别采用四种不同变异检测工具进行结构变异检测,得到第一、第二已经分型过的结构变异的vcf文件以及第一、第二结构变异vcf文件;将得到的文件进行单样本内的合并与多样本间合并,以及单样本内合并与多样本间合并,得到每个样本的单样本结构变异结果;将所有样本的单样本结构变异结果合并,得到群体规模的结构变异集合,再进行重复变异的识别以及断点位置优化。本发明中多工具并行检测的策略提升了检测的准确性和灵敏度,减少了误报,增强了插入、复制和复杂变异的检测精度,为全面捕捉基因组内不同类型的变异提供了保障。
本发明授权一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质在权利要求书中公布了:1.一种基于三代测序数据的群体规模结构变异检测方法,其特征在于,包括以下步骤: 对待检测的三代测序数据中的单个样本分别采用变异检测工具Sniffles2、CuteSV、SVision和SVision-pro进行结构变异检测,得到第一已经分型过的结构变异的vcf文件、第二已经分型过的结构变异的vcf文件、第一结构变异vcf文件与第二结构变异vcf文件; 根据第一已经分型过的结构变异的vcf文件、第二已经分型过的结构变异的vcf文件、第一结构变异vcf文件与第二结构变异vcf文件,进行单样本内的合并与多样本间合并,得到单个样本的结构变异集合; 对所有的样本进行单样本内合并与多样本间合并,得到每个样本的单样本结构变异结果;将所有样本的单样本结构变异结果合并,得到群体规模的结构变异集合; 对群体规模的结构变异集合中类型为插入的变异进行识别,判断为串联重复或是散在重复; 对群体规模的结构变异集合中类型为重复的变异进行断点优化,得到断点信息; 对待检测的三代测序数据中的单个样本分别采用变异检测工具Sniffles2、CuteSV、SVision和SVision-pro进行结构变异检测,得到第一已经分型过的结构变异的vcf文件、第二已经分型过的结构变异的vcf文件、第一结构变异vcf文件与第二结构变异vcf文件,包括以下步骤: 待检测的三代测序数据中的单个样本进行SNP的检测,得到SNP.vcf文件,对SNP.vcf文件采用分型工具Whatshap进行分型,得到bam文件,再采用Whatshap进行分型,得到分型后的bam文件,根据分型后的bam文件采用检测工具Sniffles2进行结构变异检测,得到第一已经分型过的结构变异的vcf文件; 对待检测的三代测序数据中的单个样本的未分型的bam文件,使用检测工具CuteSV进行结构变异的检测,再对得到的vcf文件进行分型,得到第二已经分型过的结构变异的vcf文件; 对待检测的三代测序数据中的单个样本分别用检测工具SVision和SVision-pro检测,分别得到第一结构变异vcf文件与第二结构变异vcf文件; 根据第一已经分型过的结构变异的vcf文件、第二已经分型过的结构变异的vcf文件、第一结构变异vcf文件与第二结构变异vcf文件,进行单样本内的合并与多样本间合并,得到单个样本的结构变异集合,包括以下步骤: 根据第一已经分型过的结构变异的vcf文件与第二已经分型过的结构变异的vcf文件,识别能够合并的artifacts和能够保留的杂合变异,再进行单样本内合并,得到单样本内的合并后的vcf文件; 将单样本内的合并后的vcf文件、第一结构变异vcf文件与第一结构变异vcf文件进行多样本间合并,得到单个样本的结构变异集合; 对群体规模的结构变异集合中类型为插入的变异进行识别,判断为串联重复或是散在重复,包括以下步骤: 提取群体规模的结构变异集合内所有类型为插入、变异长度大于50bp的记录的序列信息,根据序列信息中变异记录的ID和在染色体上发生的位置,制作fasta文件; 将制作的fasta文件与参考基因组的fasta文件进行比对,获得对应的sam文件; 对sam文件中每条记录的MAPQ列进行筛选,保留MAPQ列的值大于30且发生在组装完整的染色体上的记录,所述记录为新识别出的重复类型,再通过重复类型在sam文件中比对到参考基因组上的位置信息细分是串联重复还是散在重复。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励