聊城大学董金新获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉聊城大学申请的专利一种基于半监督学习的拷贝数变异检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120808872B 。
龙图腾网通过国家知识产权局官网在2025-12-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511303958.2,技术领域涉及:G16B20/20;该发明授权一种基于半监督学习的拷贝数变异检测方法是由董金新;杜如超;亓民勇;姜华;张誉曦;孙冉冉设计研发完成,并于2025-09-12向国家知识产权局提交的专利申请。
本一种基于半监督学习的拷贝数变异检测方法在说明书摘要公布了:本发明涉及基因变异检测技术领域,具体是一种基于半监督学习的拷贝数变异检测方法。包括从测序读段的比对信息中获取参考基因组序列每个正常窗口的读段深度信号和映射质量信号,对所有正常窗口的读段深度信号进行GC含量偏差矫正;采用循环二进制分割算法,将所有正常窗口分割为读段深度信号均一的分段区域,结合拆分读段策略识别拷贝数变异断点位置;对映射质量信号进行归一化处理;对读段深度信号进行平滑降噪处理;为对应的分段区域标注伪标签;通过改进型密度聚类算法对所有分段区域进行聚类分析,并对异常分段区域进行整合与变异类型判定,输出拷贝数变异检测结果,实现了对拷贝数变异的高效检测,并显著提升了检测结果的准确性与可靠性。
本发明授权一种基于半监督学习的拷贝数变异检测方法在权利要求书中公布了:1.一种基于半监督学习的拷贝数变异检测方法,其特征在于,包括以下步骤, 步骤一,输入参考基因组序列、待检测的测序数据样本以及种子文件,将测序数据样本与参考基因组序列进行比对、排序,获得排序后的BAM文件; 步骤二,在参考基因组坐标系下,将参考基因组序列划分为固定大小且不重叠的窗口,获取排序后BAM文件中的测序读段,根据测序读段的比对信息统计参考基因组序列所有窗口的读段计数,识别并移除参考基因组序列中包含N碱基的异常窗口,保留不包含N碱基的正常窗口;其中,对于测序读段的比对信息出现的缺失值,采用零填充的方式替代缺失值; 步骤三,从测序读段的比对信息中获取参考基因组序列每个正常窗口的读段深度信号和映射质量信号,保存参考基因组序列所有正常窗口的特征;其中,读段深度信号为RD信号,用于表示测序数据样本中碱基的测序深度;映射质量信号为MQ信号,用于表示测序数据样本与参考基因组序列比对的质量; 步骤四,对所有正常窗口的读段深度信号进行GC含量偏差矫正; 步骤五,基于矫正后的读段深度信号,采用循环二进制分割算法,将所有正常窗口分割为读段深度信号均一的分段区域,结合拆分读段策略,识别潜在的拷贝数变异断点位置; 步骤六,对所有分段区域的映射质量信号进行归一化处理; 步骤七,对所有分段区域的读段深度信号进行平滑降噪处理; 步骤八,基于种子文件中拷贝数变异的起始结束位置,为对应的分段区域标注伪标签;种子文件由多个现有拷贝数变异检测工具检测结果的交集区域构建而成,标注伪标签的分段区域若满足以下两个筛选条件,标注伪标签的分段区域属于现有拷贝数变异检测工具检测结果的交集区域,以及标注伪标签的分段区域对应的读段深度信号超过原则,即标注伪标签的分段区域的读段深度信号超过所有分段区域的读段深度信号平均值的三个标准差以上,则被视为高置信度伪标签区域,即,其中表示第个分段区域的读段深度信号,表示所有分段区域读段深度信号的平均值,表示所有分段区域读段深度信号的标准差; 步骤九,将标注伪标签的分段区域作为半监督学习聚类过程的聚类核心,所有分段区域的读段深度信号作为聚类特征,通过改进型密度聚类算法对所有分段区域进行聚类分析,所得的聚类分析结果通过聚类标签标记为正常分段区域或异常分段区域;改进型密度聚类算法基于传统密度聚类算法,在原有的邻域半径与最小邻居数两个参数的基础上,引入z-score作为改进型密度聚类算法的第三个约束条件,用于量化某一分段的读段深度信号相对于所有分段区域读段深度信号平均值的偏离程度;在满足邻域半径与最小邻居数的条件下,z-score高于偏离程度阈值的分段区域通过聚类标签标记为异常分段区域,反之标记为正常分段区域,其中,为第个分段区域的z-score,表示第个分段区域的读段深度信号,表示所有分段区域读段深度信号的平均值,表示所有分段区域读段深度信号的标准差; 步骤十,将异常分段区域进行整合与变异类型判定,输出拷贝数变异检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人聊城大学,其通讯地址为:252000 山东省聊城市东昌府区湖南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励