西南科技大学;中国工程物理研究院化工材料研究所杨春明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西南科技大学;中国工程物理研究院化工材料研究所申请的专利适用于含能化合物数据挖掘的方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115691699B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211352817.6,技术领域涉及:G16C20/30;该发明授权适用于含能化合物数据挖掘的方法及系统是由杨春明;田杰;刘建设计研发完成,并于2022-11-01向国家知识产权局提交的专利申请。
本适用于含能化合物数据挖掘的方法及系统在说明书摘要公布了:本发明公开了一种适用于含能化合物数据挖掘的方法及系统,属于化学信息学计算中含能化合物构效关系技术领域,包括步骤:S1,数据预处理;S2,提取分子拓扑结构特征和量子化学计算的特征,生成指纹普特征;S3,计算皮尔森相关性和信息熵,筛选出线性相关与非相信相关的特征,进行特征降维,删除特征之间线性相关性高于设定值的冗余特征;S4,知识挖掘与模型验证,发掘特征库之间的相关性与知识关联。本发明可以对含能材料按照骨架和基团进行数据分类,挖掘多维度的线性特征和非线性特征,将更多基于化学专业知识的特征嵌入图结构模型训练过程,利用本发明的数据挖掘引擎能够筛选出强关联的分子特征,可以弥补现有模型的不足。
本发明授权适用于含能化合物数据挖掘的方法及系统在权利要求书中公布了:1.一种适用于含能化合物数据挖掘的方法,其特征在于,包括以下步骤: S1,数据预处理:获取含能分子结构和其对应的物理化学属性值,根据组分和结构的筛选条件,筛选组分中仅含CHON四种元素的化合物,结构上含有硝基的单分子的电中性化合物,且分子中原子数量小于设定范围,将筛选结果进行去重后进行编码存储,作为数据集;再将数据集按照硝基键连化学环境的类型分类,构造类型均匀分布的训练集和测试集; S2,计算特征:分别提取预处理后的分子拓扑结构特征和量子化学计算的特征,生成指纹普特征,针对不同的材料属性,建立多个分子特征库,一个特征库包含计算得到的所有特征,完成构建特征库; S3,筛选特征:计算皮尔森相关性和信息熵,筛选出线性相关与非线性相关的特征,用递归特征消除RFECV的方法进行特征降维,删除特征之间线性相关性高于设定值的冗余特征;在步骤S3中,所述筛选特征涵盖了线性的和非线性的筛选方法,具体包括如下子步骤: 步骤1):采用皮尔森相关系数筛选特征; 步骤2):采用非线性的评估方法Copula负熵来计算非线性特征的相关性; 步骤3):选定任一机器学习模型用递归特征消除RFECV的方法来扩充候选特征库,通过将程序迭代n次来解决训练数据集的拆分和特征的随机选择过程的偶然性影响,n正整数; 步骤4):计算特征相关性矩阵,去除特征之间皮尔森Pearson线性相关性大于设定值的冗余特征,优先保留与属性值相关性强的特征; S4,知识挖掘与模型验证:发掘特征库之间的相关性与知识关联,从专家知识角度验证属性与特征的强相关性,拼接指纹普特征作为机器学习模型的输入,调整参数,在不同的模型上采用交叉验证的方法验证和评估特征,得到最优定量结构-性质关系QSPR模型,用于含能化合物数据挖掘。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西南科技大学;中国工程物理研究院化工材料研究所,其通讯地址为:621000 四川省绵阳市涪城区青龙大道中段59号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。