Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院李慧慧获国家专利权

恭喜中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院李慧慧获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院申请的专利一种自交作物杂交组合高代基因型预测模拟方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119964642B

龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510437301.9,技术领域涉及:G16B25/10;该发明授权一种自交作物杂交组合高代基因型预测模拟方法是由李慧慧;余廷熙;赵盈;黄章平设计研发完成,并于2025-04-09向国家知识产权局提交的专利申请。

一种自交作物杂交组合高代基因型预测模拟方法在说明书摘要公布了:本发明公开了一种自交作物杂交组合高代基因型预测模拟方法,包括以下步骤:构建亲本基因型数据集并筛选有效标记位点;计算标记位点间连锁不平衡系数,构建基因组连锁图谱,确定位点间重组率;利用随机模拟算法构建配子形成模型,生成F1代个体基因型;基于F1代基因型,通过自交过程随机模拟生成F2至Fn代基因型数据;采用机器学习模型建立基因型与表型的映射关系,预测高代自交株系的表型性状;本发明方法考虑了染色体交换和连锁不平衡,能够准确模拟自交作物杂交后代的基因重组和分离现象,并结合梯度提升决策树模型实现高精度的表型预测,为自交作物育种提供了高效的辅助工具,可显著缩短育种周期,提高育种效率。

本发明授权一种自交作物杂交组合高代基因型预测模拟方法在权利要求书中公布了:1.一种自交作物杂交组合高代基因型预测模拟方法,其特征在于,所述方法包括以下步骤: 步骤S1,构建自交作物杂交组合的亲本基因型数据集,对所述亲本基因型数据集进行基因组标记位点筛选,获取有效标记位点; 对亲本基因型数据集进行基因组标记位点筛选的具体步骤为: 步骤S11,计算各标记位点的多态性信息含量值: ,其中为第个等位基因的频率,为等位基因数量; 步骤S12,计算标记位点的缺失率和次要等位基因频率,剔除缺失率大于或次要等位基因频率小于的标记位点; 步骤S13,根据基因组物理位置对标记位点进行排序,当相邻标记位点间距小于预设阈值时,保留PIC值较高的标记位点; 所述预设阈值取决于自交作物种类,水稻为5-10kb,小麦为20-50kb; 步骤S2,基于亲本基因型数据,计算标记位点之间的连锁不平衡系数,构建基因组连锁图谱,确定位点间的重组率; 计算标记位点之间的连锁不平衡系数包括: 步骤S21,计算位点和之间的连锁不平衡系数:,其中为两个位点上特定等位基因组合的频率,和分别为位点和上各自等位基因的频率; 步骤S22,计算标准化连锁不平衡系数:; 步骤S23,基于值构建连锁图谱,当时认为两位点强连锁,当时认为中度连锁,当时认为弱连锁或不连锁; 确定位点间的重组率的计算公式为: ,其中为位点和之间的重组率,为位点和之间的物理距离,为自交作物染色体的平均重组长度,根据作物种类自适应调整,取值范围在cM; 步骤S3,利用随机模拟算法构建配子形成模型,根据重组率计算染色体交换概率,生成代个体的基因型; 随机模拟算法构建配子形成模型包括: 步骤S31,基于亲本基因型,随机生成同源染色体交换位点,交换位点出现的概率与位点间的重组率成正比; 步骤S32,模拟染色体交换后的配子基因型,对于两个亲本和,对于位点,若位点位于奇数交换区间内,则杂种个体在该位点的基因型来自亲本,表示为:,若位点位于偶数交换区间内,则杂种个体在该位点的基因型来自亲本,表示为:,其中和分别为亲本和亲本在位点的基因型; 步骤S33,随机选择模拟的父母配子组合形成代杂种个体,个体的基因型计算为:,其中和分别为父方和母方配子在位点k的基因型; 步骤S4,基于代个体的基因型,通过自交过程的随机模拟生成至代个体的基因型数据; 通过自交过程的随机模拟生成高世代个体的具体步骤为: 步骤S41,对个体进行自交,模拟减数分裂过程中的染色体交换,产生配子; 步骤S42,随机组合产生的配子,形成个体群体,个体在位点的基因型计算为:,其中和为两个配子在位点的基因型; 步骤S43,对个体继续进行自交,类似地生成代基因型,并依此类推生成至代; 步骤S44,计算各世代纯合度:,其中为总标记位点数,为示性函数,当位点为纯合时取值为1,否则为0;和表示位点为纯合时的两种状态; 步骤S5,采用机器学习模型建立基因型与表型的映射关系,预测高代自交株系的目标性状表现; 采用机器学习模型建立基因型与表型的映射关系包括: 步骤S51,构建训练数据集,包含已知基因型和表型的样本数据,将数据按7:3的比例划分为训练集和验证集; 步骤S52,采用梯度提升决策树模型GBDT作为核心预测模型,该模型由多个决策树组成,模型参数计算过程为: 初始化模型,其中,为损失函数;表示寻找使后面表达式最小化的值,为预测值,为第个样本的真实表型值; 对于,为决策树数量,第轮迭代中第个样本的残差: ,为损失函数对当前预测值的偏导数,为第m-1轮迭代后的模型,为第个样本的基因型数据;拟合残差生成决策树,得到第轮迭代中第个叶节点区域; 计算每个叶节点的最优输出值:;更新模型:,其中为学习率,取值范围; 步骤S53,模型优化采用折交叉验证方法,,通过网格搜索确定最优超参数,包括学习率、树的最大深度、决策树数量和最小叶节点样本数; 步骤S54,基于步骤S4中生成的高代基因型数据,使用优化后的模型预测目标性状值:,其中为基因型数据矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国农业科学院作物科学研究所;三亚中国农业科学院国家南繁研究院,其通讯地址为:100081 北京市海淀区中关村南大街12号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。