Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 艾信博(滨海)生物医学科技有限公司程小涛获国家专利权

艾信博(滨海)生物医学科技有限公司程小涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉艾信博(滨海)生物医学科技有限公司申请的专利一种单细胞大数据分析系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120089197B

龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510129665.0,技术领域涉及:G16B20/30;该发明授权一种单细胞大数据分析系统和方法是由程小涛设计研发完成,并于2025-02-05向国家知识产权局提交的专利申请。

一种单细胞大数据分析系统和方法在说明书摘要公布了:一种单细胞大数据分析系统,包括高通量测序数据采集模块模块、单细胞公共数据模块、批次矫正模块、智能注释模块、巨量统计模块、个性化分析模块、可视化输出模块,其特征在于:所述高通量测序数据采集模块模块,从Ensembl、UCSC或NCBI公共数据库下载所需物种的参考基因组FASTA文件。本发明的单细胞大数据分析系统和方法具有囊括众多公共数据库,用最新算法完成聚类注释工作,同时给出多种精准智能注释结果,并对每种注释结果,完成巨量统计,提升分析效率,建立可视化、流程化的国产单细胞数据分析平台,实现智能图表的绘制、选择,实现CNS级别研究成果的重挖掘,协助科研人员降低研发投入和实现数据的高效合理利用的优点。

本发明授权一种单细胞大数据分析系统和方法在权利要求书中公布了:1.一种单细胞大数据分析系统,包括高通量测序数据采集模块模块、单细胞公共数据模块、批次矫正模块、智能注释模块、巨量统计模块、个性化分析模块、可视化输出模块,其特征在于: 所述高通量测序数据采集模块模块,从Ensembl、UCSC或NCBI公共数据库下载所需物种的参考基因组FASTA文件; 所述单细胞公共数据模块,为人、大小鼠、猪、恒河猴、麋鹿、果蝇、家蚕、斑马鱼、蝾螈、水稻、拟南芥的公开单细胞数据; 所述批次矫正模块,包括建立在MNN、graph-based、Deep-learn基础上开发的算法流程,以及跨物种分析流程; 所述智能注释模块,包括采用AysenseBio2.0注释系统,构建数百种组织特异性的智能注释模型; 所述巨量统计模块,包括注释统计作图,组间差异作图,以及注释X分组的复杂分析作图、GSEA、GSVA分析; 所述个性化分析模块,包括自动化完成拟时序、细胞间通讯、反卷积、转录因子分析数十种分析; 所述可视化输出模块,包括聚类图、气泡图、热图、通讯差异图多种交互分析图的输出; 其中,a、高通量测序数据采集模块,包括以下步骤: 1从Ensembl、UCSC或NCBI公共数据库下载所需物种的参考基因组FASTA文件,配合对应的GTF文件,并使用mkref命令创建一个新的参考基因组数据库; 2使用mkfastq命令将BCL文件转换为FASTQ格式文件,并对低质量reads进行数据质控与数据过滤; 3将FASTQ格式文件与相应的参考基因组进行序列比对;使用CellRanger比对软件,读取每个样品目录中的FASTQ数据,比对每条reads序列到参考基因组数据库,并解码细胞条形识别码与唯一特征识别序列; 4转换为count的矩阵文件;在获取所述的解码细胞条形识别码后,将解码细胞条形识别码与唯一特征识别序列进行计数,构建基因-细胞的表达矩阵; b、单细胞公共数据库模块,包括人、大小鼠、猪、恒河猴、麋鹿、果蝇、家蚕、斑马鱼、蝾螈、水稻、拟南芥的公开单细胞数据,对公开单细胞数据统一处理成标准的rds格式数据,并进行规范的细胞注释,所述处理方法包括以下步骤; 从GEO、SingleCellPortal数据库中下载整理各类矩阵数据,并经过统一的归一化矫正算法,将所有分配到特定细胞中的UMI数字求和,作为总的测序深度细胞属性,并在负二项式误差分布和对数链接函数回归模型中使用所述细胞属性,构建回归模型,校正细胞之间测序深度差异,并标准化数据: logExi=β0+β1log10m; 其中:xi是基因i的UMI计数向量,m是分配给细胞的分子向量,即mj=ixij,所述回归模型问题的解是一组参数:截距β0和斜率β1,底层分布的离散度参数θ是未知的,通过拟合负二项式回归模型来估计这个参数; c、批次矫正模块,包括建立在MNN、graph-based、Deep-learn基础上开发的算法流程,以及跨物种分析流程: 1计算每个批次内所有细胞之间的相似度矩阵,设X是一个n×p的矩阵,其中每行代表一个细胞的表达谱数据,相似度矩阵S定义为: 其中:σ是一个控制距离衰减速度的参数; 2通过计算每个批次内所有细胞之间的相似度矩阵,确定每个批次中最相似的一组锚点,设Sb表示第b批次的细胞之间的相似度矩阵,定义一个代价函数C: 其中:A是一组由∣A∣个锚点组成的集合,Ab表示第b批次的锚点集合,λ是一个正则化系数,用于惩罚锚点数量过多的情况,目标是最小化代价函数C; 将每个非锚点细胞映射到与其最近的锚点所在的低维空间中,设x表示第i个细胞的表达谱数据,ak表示第k个锚点的表达谱; d、智能注释模块,包括采用AysenseBio2.0注释系统,构建数百种组织特异性的智能注释模型,包括以下步骤: 1输入一个包含已知细胞类型的scRNA-seq数据集作为训练集,每个细胞样本有表达谱,即每个基因的表达水平; 2从训练数据中选择具有区分度的基因作为特征,所述基因在不同细胞类型之间有显著的表达差异; 3设n个细胞类型,或标签,对于每一个标签i,训练一个回归模型,所述回归模型表示为: 其中:是第i类标签的二元输出,为0,或1; x是输入特征向量,系基因表达水平; 是与第i类相关的权重向量; 是偏置项,截距; 是逻辑函数,用于将线性组合的结果映射到0,1的概率区间内;。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人艾信博(滨海)生物医学科技有限公司,其通讯地址为:224500 江苏省盐城市滨海经济开发区工业园南区电子智慧园16栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。