慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司金羽童获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司申请的专利一种清洗小分子化合物的数据预处理系统及其方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115171814B 。
龙图腾网通过国家知识产权局官网在2026-02-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210844053.6,技术领域涉及:G16C20/90;该发明授权一种清洗小分子化合物的数据预处理系统及其方法是由金羽童;吴俊峰;潘麓蓉设计研发完成,并于2022-07-18向国家知识产权局提交的专利申请。
本一种清洗小分子化合物的数据预处理系统及其方法在说明书摘要公布了:本发明提供一种清洗小分子化合物的数据预处理方法,所述数据预处理方法包括:S1文本预处理步骤,所述S1文本预处理步骤包括:将所述小分子化合物的原始SMILES文本预处理为所述小分子化合物的标准化SMILES文本;S2化学图格式化步骤,所述S2化学图格式化步骤包括:将所述S1的所述小分子化合物的所述标准化的SMILES文本的各个文本元素进行格式拆分,获得所述小分子化合物的化学图信息。本发明还提供一种清洗小分子化合物的数据预处理系统。本发明实现了全局数据集的清洗、去重、以及标准化,提供一种高效、快速、精准的端到端小分子化合物清洗整合方法。
本发明授权一种清洗小分子化合物的数据预处理系统及其方法在权利要求书中公布了:1.一种清洗小分子化合物的数据预处理方法,其特征在于,所述数据预处理方法包括: S1文本预处理步骤,所述S1文本预处理步骤包括:根据预定的文本处理规则,将小分子化合物的原始SMILES文本,预处理为小分子化合物的标准化SMILES文本;其中,所述预定的文本处理规则包括: S1‑1步骤:可选的结构标准化,其中将所述小分子化合物的数据处理为原始SMILES文本; S1‑2步骤:若所述原始SMILES文本包括重金属成分和有机化合物成分,则在所述原始SMILES文本中去除重金属成分,保留有机化合物成分; S1‑3步骤:若所述原始SMILES文本包括多聚体成分,则在所述原始SMILES文本中去除多聚体成分,保留最长成分; S1‑4步骤:若所述原始SMILES文本包括电荷,则在所述原始SMILES文本中加减氢原子,实现去电荷; S1‑5步骤:去除特殊SMILES文本信息; S1‑6步骤:输出标准化的序列,得到所述小分子化合物的标准化SMILES文本; S2化学图格式化步骤,所述S2化学图格式化步骤包括:根据预定的文本处理规则,将所述S1的所述小分子化合物的所述标准化的SMILES文本的各个文本元素进行格式拆分,获得所述小分子化合物的化学信息的数字化图结构;其中,所述预定的文本处理规则包括: S2‑1步骤:将S1所述小分子化合物的所述标准化的SMILES文本拆分为各个核心的文本元素,得到所述小分子化合物的文本元素; S2‑2步骤:对所述S2‑1步骤的所述小分子化合物的文本元素的性质进行文本处理识别,识别并补全简化的化学信息,得到所述小分子化合物的化学信息图; S2‑3步骤:根据所述S2‑2步骤的所述小分子化合物的化学信息图,建立以原子元素为节点的坐标系统,构建所述小分子化合物的化学信息图的数字化坐标系统; S2‑4步骤:根据所述S2‑3步骤的所述小分子化合物的化学信息图的数字化坐标系统,添加节点与边的元素属性,得到所述小分子化合物的化学信息的数字化图结构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人慧壹科技(上海)有限公司;香港圆壹智慧有限公司;美国圆壹智慧科技有限公司,其通讯地址为:201316 上海市浦东新区中国(上海)自由贸易试验区临港新片区环湖西二路888号C楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励