哈尔滨工业大学姜涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利一种基于泛基因组遗传信息的单倍体建模方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785884B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411982659.1,技术领域涉及:G16B30/00;该发明授权一种基于泛基因组遗传信息的单倍体建模方法是由姜涛;于宏扬;刘亚东;王亚东设计研发完成,并于2024-12-31向国家知识产权局提交的专利申请。
本一种基于泛基因组遗传信息的单倍体建模方法在说明书摘要公布了:一种基于泛基因组遗传信息的单倍体建模方法,涉及基因工程技术领域,针对现有单倍体建模效率低的问题,本申请通过核心序列机制以及滑动窗口机制,旨在尽可能地确保人类基因组中“必须基因”的存在,并且本申请将泛基因组划分为多个核心窗口使单个窗口成为相对独立个体后的并行,实现支持高度并行化的建模,在确保真实性建模的基础上提高了建模效率。
本发明授权一种基于泛基因组遗传信息的单倍体建模方法在权利要求书中公布了:1.一种基于泛基因组遗传信息的单倍体建模方法,其特征在于包括以下步骤: 步骤一:获取泛基因组数据,并将泛基因组数据中的序列段划分为核心序列段和非核心序列段; 步骤二:基于划分后的核心序列段和非核心序列段进行核心窗口的划分; 步骤三:将线性参考单倍体作为索引,依据核心序列段和核心窗口作为骨架,进行核心窗口并行的单倍体建模; 所述步骤一的具体步骤为: 步骤一一:获取泛基因组数据,并获取泛基因组数据中序列段的反向互补序列段; 步骤一二:将所有泛基因组中序列段的反向互补序列按照其原有的正向连接方式添加到泛基因组中; 步骤一三:对泛基因组中序列段进行频次统计,若序列段出现次数与泛基因组中的单倍体总数相同,则将该序列段为泛基因组的核心序列段,其余为非核心序列段; 所述步骤二的具体步骤为: 步骤二一:将每个序列段视为一个独立个体,以线性参考单倍体GRCh38为索引,每五千个线性参考单倍体GRCh38的序列段为一个序列窗口,以此进行序列窗口的划分; 步骤二二:针对同一个序列窗口,分别获取距离该序列窗口两个端点距离最近的核心序列段,两个核心序列段构成的窗口即为核心窗口; 所述步骤三中单倍体建模的具体步骤为: 步骤三一:创建进程池,依据预先设定的进程数量,并采用窗口索引与进程编号映射方法,将核心窗口进行均匀分配,并将分配后的每个核心窗口传递至对应的单个子进程之中,之后通过进程独有的虚拟地址空间,将核心窗口由页表映射到物理内存中; 步骤三二:当序列段后端具有多个并列的序列段时,采取基于梅森旋转算法生成高质量伪随机数的策略,在多个泛序列段中根据伪随机数选择其中的一个泛序列段作为单倍体组成构件,并通过深度优先搜索的策略继续向深处随机寻找后面的序列段,直至线性参考序列的末端序列段搜索完毕,表示为: 其中,M为梅森旋转函数,r为生成的随机数,为序列段ti的并列序列段集合,tend为使深度优先搜索终止的核心序列段,tnext为接收的序列段,tir为根据随机数所选择的序列段,tcurrent为当前序列段,length表示对集合长度,B表示对当前序列的所有直接相连子序列段求集合,DFS表示搜索过程中一直对当前序列段采取深度优先的策略; 在单倍体建模过程中,设置路径存储栈和序列段访问存储栈,在每一次向下游搜寻序列段并确定其在单倍体拓扑结构中的位置时,将该路径信息压入路径存储栈中,将该序列段压入序列段访问存储栈中,之后对每个搜寻得到的序列段进行冗余判定,即判定该序列段是否存在于序列段访问存储栈中,若存在,则弹出后入栈的该序列段,并将该序列段在泛基因组中标记为不可选择序列,并重新进行此处的随机选择,若不存在,则将该序列段压入序列段访问存储栈,并将此序列段添加进入路径,进而更新路径信息和路径存储栈后,继续搜索; 计算核心序列段间线性参考单倍体GRCh38的序列段个数,并将其作为两核心序列段间的标定距离,若标定距离超过设定的序列窗口间距,则将建模过程中的合法距离设为无穷大,否则,将合法距离设置为标定距离的平方,合法距离表示为: 其中,pi为建模时搜索到的序列段,pj为第j个核心序列段,Lij为合法距离; 若建模时,两个核心序列段间的标定距离超过合法间距,则通过路径存储栈和序列段访问存储栈删除两个核心序列段间已入栈的路径和已访问的序列段,并回溯到两个核心序列段间的开始处,重新进行搜索,直至完成全部核心窗口的建模,得到每个进程的拓扑结构,之后将并行进程的拓扑结构进行映射拼接,得到完整的单倍体拓扑表示,最后,将完整的单倍体拓扑表示具象为碱基序列,形成预期的单倍体,完成建模; 每个进程的拓扑结构表示为: 其中,Sp为存储已探索路径的栈,Sv为存储已访问序列段的栈,Tk为第k个窗口的单倍体部分拓扑结构,n为窗口的总数,Tfinal为最终完整的单倍体拓扑结构,为pi到pj之间所有入栈的路径,x为pi和pj之间入栈的所有序列段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励