浙江大学张寅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种基于图池化数据增强的分子图对比学习预训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116434872B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310227611.9,技术领域涉及:G16C20/70;该发明授权一种基于图池化数据增强的分子图对比学习预训练方法是由张寅;滑紫旭设计研发完成,并于2023-03-10向国家知识产权局提交的专利申请。
本一种基于图池化数据增强的分子图对比学习预训练方法在说明书摘要公布了:本发明公开了一种基于图池化数据增强的分子图对比学习预训练方法。本发明包括以下步骤:1预训练模型准备:设计双塔预训练模型,为对比学习选取两种不同的图池化方式作为数据增强手段。2执行对比学习预训练:采用对比学习的方式进行分子图预训练。3执行分子图下游任务:使用预训练好的模型参数初始化图分类任务模型用于下游任务。和现有技术相比,本发明针对图神经网络预训练,首次提出了一种简单便捷的数据增强方式,无需设计复杂的数据增强预处理,只需要使用两种不同的图池化方式就可以实现图神经网络对比学习预训练,能够更便捷地应用于图的下游任务场景。
本发明授权一种基于图池化数据增强的分子图对比学习预训练方法在权利要求书中公布了:1.一种基于图池化数据增强的分子图对比学习预训练方法,其特征在于,包括以下步骤: S1:获取分子图数据集,并对数据集中的每个分子图样本进行预处理,提取其原子特征和化学键特征作为基本特征,同时提取分子图样本的骨架结构并对原子和化学键进行骨架编码,形成由原子骨架编码和化学键骨架编码组成的骨架特征; S2:构建包含两路模型分支和对比学习投影头的预训练双塔模型,第一路分支由自然更新的在线编码器和第一图池化层级联而成,第二路分支由采用动量更新的动量编码器和第二图池化层级联而成,两路分支中的编码器均使用图神经网络;预训练双塔模型的输入为基本特征和骨架特征,其中原子特征和原子骨架编码各自经过嵌入层后相加形成原子嵌入,化学键特征和化学键骨架编码各自经过嵌入层后相加形成化学键嵌入,原子嵌入和化学键嵌入同时作为两路分支中编码器的输入,而两路分支中的第一图池化层和第二图池化层采用不同的图池化算法,从而同一个输入在两路分支中得到存在信息量差异的不同分子图表征,最后通过将不同分子图表征输入对比学习投影头中生成对比学习损失; S3:利用S1中预处理后的分子图数据集,采用对比学习的方式对所述预训练双塔模型进行预训练,通过计算对比学习损失使模型学习到分子图的通用分布表示,保存最终预训练好的在线编码器和第一图池化层; S4:在S3预训练好的在线编码器和第一图池化层之后连接分子性质预测头,从而构建成为分子性质预测模型;将分子性质预测模型在分子性质预测任务数据集上进行微调后,用于进行分子性质预测任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。