扬州大学朱腾义获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉扬州大学申请的专利基于可解释性机器学习的抗生素抗性基因的宿主分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120148651B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510284448.9,技术领域涉及:G16B40/20;该发明授权基于可解释性机器学习的抗生素抗性基因的宿主分析方法是由朱腾义;李懿;陶翠翠;李书音;吴军设计研发完成,并于2025-03-11向国家知识产权局提交的专利申请。
本基于可解释性机器学习的抗生素抗性基因的宿主分析方法在说明书摘要公布了:本发明公开了生物信息学技术领域内的一种基于可解释性机器学习的抗生素抗性基因的宿主分析方法,包括以下步骤:步骤1基因组数据收集:收集同种环境样品的大量基因组数据,计算基因数据中抗生素抗性基因、物种菌属的种类和相对丰度并将其处理成矩阵,使用Pauta准则对选定抗生素抗性基因的相对丰度进行分析、去除异常值后划分训练集和测试集;步骤2分析模型的构建;步骤3可解释的相关性分析:通过Shap值量化模型中不同菌属对抗生素抗性基因的贡献,根据不同菌属平均Shap值的差异判断菌属对于抗生素抗性基因的影响,本发明可以分析多种细菌菌属与抗生素抗性基因的相关性,为抗生素抗性基因的生态风险评价和管理提供必要的技术支持。
本发明授权基于可解释性机器学习的抗生素抗性基因的宿主分析方法在权利要求书中公布了:1.一种基于可解释性机器学习的抗生素抗性基因的宿主分析方法,其特征在于,包括以下步骤: 步骤1基因组数据收集:收集同种环境样品的大量基因组数据,计算基因数据中抗生素抗性基因、物种菌属的种类和相对丰度并将其处理成矩阵,使用Pauta准则对选定抗生素抗性基因的相对丰度进行分析、去除异常值后划分训练集和测试集; 步骤2分析模型的构建: 2-1首先使用随机森林算法对物种菌属矩阵建立初始相关性分析模型; 2-2计算每个菌属的均方误差增加百分比%IncMSE以衡量菌属的重要性,公式如下: ; 其中:MSEoriginal是不打乱特征值时的均方误差;MSErandom是打乱特征值后的均方误差; 执行五次10折交叉验证得到用于拟合的最重要菌属数量与平均交叉验证误差之间的关系,选取平均交叉验证误差最小的菌属个数为理想的变量个数,筛选出最终菌属矩阵,交叉验证误差公式如下: ; 其中:k是折数,为10;MSEi是第i折的均方误差; 2-3通过CatBoost回归算法建立抗生素抗性基因-细菌菌属相关性模型,使用网格搜索选取最优超参数,构建基于RF-CatBoost算法的抗生素抗性基因-细菌菌属相关性模型; RF-CatBoost模型的预测值为各决策树预测的加权和: ; 其中,是初始预测值,通常是目标值的均值;fmx是第𝑚棵树的输出;是学习率;M是树的数量; 2-4对模型的拟合度、稳健性和分析能力进行验证; 步骤3可解释的相关性分析:通过Shap值量化模型中不同菌属对抗生素抗性基因的贡献,根据不同菌属平均Shap值的差异判断菌属对于抗生素抗性基因的影响;SHAP值用以将模型的预测结果分解为每个特征的贡献值,即: ; 其中,是模型的预测值;是模型的基准值,通常是平均初始值;是第i个菌属的Shap值,标志xi菌属对模型的贡献; 对于菌属xi,其SHAP值定义为所有可能菌属子集的加权平均边际贡献: ; 其中,是菌属的一个子集,且;是在菌属子集下的模型预测值;是在子集加上菌属xi后的模型预测值;n是菌属的总数,是子集的大小;是对每个子集的贡献进行加权的系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人扬州大学,其通讯地址为:225000 江苏省扬州市大学南路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励