Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 东北林业大学章天骄获国家专利权

东北林业大学章天骄获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉东北林业大学申请的专利一种基于单细胞多组学数据进行细胞类型划分的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119446253B

龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411290050.8,技术领域涉及:G16B20/00;该发明授权一种基于单细胞多组学数据进行细胞类型划分的方法是由章天骄;张宏飞;汪国华设计研发完成,并于2024-09-14向国家知识产权局提交的专利申请。

一种基于单细胞多组学数据进行细胞类型划分的方法在说明书摘要公布了:本发明涉及一种基于单细胞多组学数据进行细胞类型划分的方法,属于生物信息学技术领域。解决常用技术形成的高噪声和高稀疏性的问题。包括如下步骤,步骤一,构建深度神经网络模型,步骤二,获取单细胞多组学综合数据集,步骤三,对所述单细胞多组学数据集进行预处理,步骤四,基于预处理后的单细胞多组学数据集对深度神经网络模型进行训练,步骤五,基于训练后的深度神经网络模型对待测数据进行细胞类型划分。本发明提出scDRMAE模型,通过两个并行的MAE模块捕捉不同组学的依赖关系,将通常被忽略的因素考虑到细胞聚类之中并借助其中的掩码预测机制实现了对不同组学数据的插补,最后通过注意力机制有效融合各个组学数据,提高了模型细胞聚类的准确性。

本发明授权一种基于单细胞多组学数据进行细胞类型划分的方法在权利要求书中公布了:1.一种基于单细胞多组学数据进行细胞类型划分的方法,其特征在于,包括如下步骤: 步骤一:构建深度神经网络模型; 步骤二:获取单细胞多组学数据集; 步骤三:对所述单细胞多组学数据集进行预处理; 步骤四:基于预处理后的单细胞多组学数据集对深度神经网络模型进行训练; 步骤五:基于训练后的深度神经网络模型对待测数据进行细胞类型划分; 对深度神经网络模型的训练步骤包括: 步骤一、生成掩码数据,对原始数据数据矩阵中部分特征内部进行随机洗牌; 步骤二、生成一个各项均服从伯努利分布的掩码矩阵MRNA-seq,表示如下: MRNA-seq~BernoulliP1 公式1中,P表示不同细胞不同基因发生dropout事件的概率; 由此通过对scRNA-seq的原始数据XRNA-seq、扰乱数据和掩码矩阵MRNA-seq进行组合得到带有掩码的数据矩阵xRNA-seq,表示如下: 同样其他组学的掩码数据xothers,表示如下: 步骤三、掩码解码器中和用于从不同组学的低维表示ZRNA-seq和Zothers中预测不同组学数据对应的掩码矩阵,表示如下: 公式4中,和分别表示不同组学的编码器,M′RNa-seq和M′others是掩码解码器预测得到的不同组学的掩码矩阵; 通过使用二元交叉熵损失作为掩码预测损失LM,使得模型能够学习组学数据中dropout事件,表示如下: 公式6、7、8中和分别表示不同组学的掩码预测损失,n表示细胞个数,g和p分别表示不同组学数据的特征维度,和表示真实的掩码矩阵,和表示掩码解码器预测的掩码矩阵; 将预测得到的不同组学的掩码矩阵和低维表示合并传入解码器,用于对不同组学数据重建,表示如下: 公式8和9中X′RNA-seq和X′others分别表示不同组学数据的重建数据; 通过计算不同组学的重建数据与原始数据的均方误差作为重建损失LR,同时为损坏和未损坏的基因分配不同的权重,表示如下: 和分别表示不同组学数据的重建损失,和分别表示scRNA-seq数据和其他组学数据被扰乱的特征和未被扰乱的特征的重建权重; 步骤四、将不同组学低维表示进行串联,表示如下: Z=[ZRNA-seq,Zothers]13 通过注意力机制对Z进行特征变换,使得Z能够更加关注那些对聚类结果重要的特征; 采用和transformer一样的策略,将Z映射到三个不同的特征子空间: K=ZW1;Q=ZW2;V=ZW314 公式14中W1,W2和W3分别表示三个用于映射变化的权重矩阵,K、Q、V则表示Z经过线性变换后的三个特征编码; 用K、Q计算全局关系矩阵W: 其中d表示Z的特征维度; 借助W对V进行特征增强,得到增强后的特征 b为偏差; 通过将scRNA-seq数据特征Zr再次和融合,以获得信息更加丰富的特征表示表示如下: 引入了KL损失作为约束,利用t分布描述细胞i和细胞j之间的相似性: 公式18中和表示细胞i和j的编码表示,qij表示软分配,用于表示细胞i和j之间的成对相似度; pij是基于qij构建的目标分布,是通过对qij进行归一化处理得到的,计算过程如下: 通过求两个分布的KL散度,对特征进行约束,从而提高聚类效果: 步骤五:获取单细胞多组学融合数据之后,通过Kmeans算法对单细胞多组学融合数据进行聚类分析。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北林业大学,其通讯地址为:150040 黑龙江省哈尔滨市香坊区和兴路26号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。