Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东南大学李健获国家专利权

东南大学李健获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东南大学申请的专利一种基于Spark的分布式序列比对方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119851761B

龙图腾网通过国家知识产权局官网在2025-11-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510070987.2,技术领域涉及:G16B30/10;该发明授权一种基于Spark的分布式序列比对方法及系统是由李健;曹哲奇;翟天章;张扬;潘入墨设计研发完成,并于2025-01-16向国家知识产权局提交的专利申请。

一种基于Spark的分布式序列比对方法及系统在说明书摘要公布了:本发明公开了一种基于Spark的分布式序列比对方法及系统,涉及生物信息学技术领域,包括:接收Minimap2参考序列,基于Minimap2的多部分索引生成功能生成参考序列的多部分索引;基于参考序列的多部分索引内的字符串作为标识符将参考序列的多部分索引进行分区,得到分区副本,将分区副本分发至Spark集群的各个节点上;接收查询序列,对查询序列通过FASTA或FASTQ的文件格式进行分区,基于参考序列的分区数量和查询序列的分区数量以及各个节点上的分区副本生成多节点共享任务队列;各个节点基于多节点共享任务队列,选择自身所有索引文件分区副本对应的任务队列中需要处理剩余所有任务所需花费的时间最长的任务队列中的任务进行处理,得到任务处理结果。结合了查询序列分区和参考序列数据库分区的策略,通过建立多节点共享任务队列实现动态负载均衡,优化了Minimap2与大规模数据集比对时的效率。适用于第三代测序技术产生的长序列数据,特别适用于现场快速测序与分析的应用场景。

本发明授权一种基于Spark的分布式序列比对方法及系统在权利要求书中公布了:1.一种基于Spark的分布式序列比对方法,其特征在于,方法包括以下步骤: 接收Minimap2参考序列,基于Minimap2的多部分索引生成功能生成参考序列的多部分索引;基于参考序列的多部分索引内的字符串作为标识符将参考序列的多部分索引进行分区,得到分区副本,将分区副本分发至Spark集群的各个节点上; 接收查询序列,对查询序列通过FASTA或FASTQ的文件格式进行分区,基于参考序列的分区数量和查询序列的分区数量以及各个节点上的分区副本生成多节点共享任务队列; 所述各个节点上存放了多个不同索引文件分区的副本,并建立多节点共享任务队列,每个节点通过任务队列中处理剩余所有任务所需花费的时间选择需要处理的任务; 所述节点的选择公式为: 为最终选择的任务队列,为节点对应的任务队列优先级队列中任务还未被全部执行的所有任务队列,为任务队列剩下的还未被执行的任务数,为任务队列中正在被执行的任务数,argmax返回的是函数最大值时的输入值x,其中,; 各个节点基于多节点共享任务队列,选择自身所有索引文件分区副本对应的任务队列中需要处理剩余所有任务所需花费的时间最长的任务队列中的任务进行处理,得到任务处理结果; 所述多节点共享任务队列的生成过程: 指定每个数据库分区的副本数量,数据库分区数量以及集群中的节点数量; 根据副本数量、数据库分区数量以及节点数量生成每个节点上存储的索引文件分区副本; 指定查询序列分区数量; 生成查询序列分区,并将分区文件上传至HDFS上; 为每一个索引文件分区生成一个多节点共享任务队列,在每个索引文件分区对应的任务队列中依次存放每个查询序列分区在HDFS中的路径; 所述各个节点基于多节点共享任务队列的任务处理过程如下: 每个节点遍历其所有索引文件分区副本对应的任务队列,并找出其中剩余任务数除以正在被执行任务数最大的任务队列,从中获取查询序列分区在HDFS中的路径;如果所有任务队列中都没有任务,则不进行任务处理; 若任务队列存在任务,则将HDFS中的查询序列分区拉取至节点本地,并将其与任务队列对应的索引文件分区进行比对; 继续从任务队列中获取查询序列分区路径,若任务队列中没有剩余任务,则重新判断任务队列是否存在任务;否则重新进行比对过程; 收集所有比对任务的输出结果,并合并为任务处理结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211189 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。