中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院李慧慧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院申请的专利基于机器学习的作物全基因组预测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120164521B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510643432.2,技术领域涉及:G16B20/00;该发明授权基于机器学习的作物全基因组预测方法及系统是由李慧慧;高尚;何坤辉;张治梁设计研发完成,并于2025-05-19向国家知识产权局提交的专利申请。
本基于机器学习的作物全基因组预测方法及系统在说明书摘要公布了:本发明提供一种基于机器学习的作物全基因组预测方法及系统,首先获取目标作物多个生长周期内的基因表达数据集合,基因表达数据集合含多个由遗传标记和表型性状数据组成的基因序列样本,接着对基因表达数据集合进行特征提取,得到基因关联特征和生长性状特征,然后利用预设机器学习模型对基因关联特征和生长性状特征进行融合预测,生成融合预测特征,依据此融合预测特征确定全基因组预测结果,该全基因组预测结果可指示作物在不同环境下的性状表达趋势,最后基于全基因组预测结果生成适应性优化策略并反馈至作物培育系统,触发培育参数调整,实现作物培育的精准化和智能化,提升培育效率与作物适应性。
本发明授权基于机器学习的作物全基因组预测方法及系统在权利要求书中公布了:1.一种基于机器学习的作物全基因组预测方法,其特征在于,所述方法包括: 获取目标作物在多个生长周期内的基因表达数据集合,所述基因表达数据集合包括多个基因序列样本,每个基因序列样本由至少一个基因位点的遗传标记和对应的表型性状数据组成; 对所述基因表达数据集合进行特征提取,得到每个基因序列样本的基因关联特征和生长性状特征; 基于预设的机器学习模型对所述基因关联特征和所述生长性状特征进行融合预测,生成所述基因序列样本的融合预测特征; 根据所述融合预测特征确定所述目标作物的全基因组预测结果,所述全基因组预测结果用于指示所述目标作物在不同环境条件下的性状表达趋势; 基于所述全基因组预测结果生成适应性优化策略,并将所述适应性优化策略反馈至作物培育系统以触发培育参数调整操作; 所述对所述基因表达数据集合进行特征提取,得到每个基因序列样本的基因关联特征和生长性状特征,包括: 遍历所述基因表达数据集合中的每个基因序列样本,提取所述基因位点的遗传标记之间的连锁不平衡系数; 调用预训练的基因特征编码器对各个所述连锁不平衡系数进行多层级编码处理,生成所述基因序列样本的基因交互特征向量; 对所述表型性状数据进行环境适应性分析处理,得到所述基因序列样本在不同生长环境下的性状稳定性评分; 将所述基因交互特征向量和所述性状稳定性评分进行特征对齐处理,得到所述基因序列样本的基因关联特征; 对所述基因序列样本的遗传标记进行性状关联映射处理,得到所述基因序列样本的生长性状特征; 所述对所述基因序列样本的遗传标记进行性状关联映射处理,得到所述基因序列样本的生长性状特征,包括: 获取所述基因序列样本在不同生长周期内的表型性状数据,提取所述表型性状数据的动态变化梯度; 根据所述动态变化梯度与所述遗传标记的连锁不平衡系数之间的Spearman秩相关系数,构建性状关联映射矩阵; 对所述性状关联映射矩阵进行奇异值分解处理,得到所述表型性状数据的主成分特征; 对所述主成分特征进行标准化处理,并对所述基因交互特征向量进行归一化处理,将标准化后的主成分特征与归一化后的基因交互特征向量进行特征维度对齐,通过多层感知机进行非线性空间投影处理,得到所述基因序列样本的生长性状特征; 所述基于预设的机器学习模型对所述基因关联特征和所述生长性状特征进行融合预测,生成所述基因序列样本的融合预测特征,包括: 对所述基因关联特征进行标准化处理,得到标准化基因关联特征; 对所述生长性状特征进行归一化处理,得到归一化生长性状特征; 调用所述机器学习模型中的动态权重分配模块,根据所述标准化基因关联特征与所述归一化生长性状特征之间的相关性评分生成特征融合权重; 通过所述机器学习模型的第三全连接层将所述标准化基因关联特征和所述归一化生长性状特征统一至相同维度后,基于所述特征融合权重进行加权拼接处理,得到所述基因序列样本的融合预测特征; 所述根据所述融合预测特征确定所述目标作物的全基因组预测结果,包括: 调用预训练的基因组预测模型对所述融合预测特征进行跨环境泛化处理,得到所述目标作物在预设环境变量下的性状表达概率分布; 提取所述性状表达概率分布中方差超过预设阈值的基因位点标识符,生成候选关键位点集合; 计算所述候选关键位点集合中每个基因位点在环境扩展特征中的特征激活强度,筛选激活强度均值高于遗传显著性水平的基因位点形成关键基因位点集合; 将所述性状表达概率分布与所述关键基因位点集合进行特征关联绑定处理,生成所述全基因组预测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院,其通讯地址为:100081 北京市海淀区中关村南大街12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。