中国人民解放军总医院第二医学中心孙沙沙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国人民解放军总医院第二医学中心申请的专利数据缺失值填充方法、装置、设备、介质及程序获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119943244B 。
龙图腾网通过国家知识产权局官网在2025-07-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510078831.9,技术领域涉及:G16H10/60;该发明授权数据缺失值填充方法、装置、设备、介质及程序是由孙沙沙;刘传鲁;范振平;佐国琴设计研发完成,并于2025-03-28向国家知识产权局提交的专利申请。
本数据缺失值填充方法、装置、设备、介质及程序在说明书摘要公布了:本申请涉及数据处理技术领域,特别涉及一种数据缺失值填充方法、装置、设备、介质及程序,其中,方法包括:将目标数据划分为多个离散时间数据;获取目标数据库中每个病患的关键关联特征,其中,关键关联特征表示与目标数据的相关特征;将关键关联特征输入判读模型,判读模型输出对应的预测结果,其中,预测结果为目标数据落入对应离散时间结果;将预测结果关联对应的随访数据填充至缺失数据库。由此,解决了相关技术中数据缺失值填充处理采用均值、中位数或众数填补,导致数据准确性和可靠性较差等问题。
本发明授权数据缺失值填充方法、装置、设备、介质及程序在权利要求书中公布了:1.一种数据缺失值填充方法,其特征在于,包括以下步骤: 将目标数据划分为多个离散时间数据; 获取目标数据库中每个病患的关键关联特征,其中,关键关联特征表示与目标数据的相关特征; 将所述关键关联特征输入判读模型,所述判读模型输出对应的预测结果,其中,预测结果为目标数据落入对应离散时间结果,其中,所述判读模型的训练过程:获取历史随访数据;将所述历史随访数据中离散特征数据格式预处理转换为序列整数生成数值化特征;筛选数值化特征中关键关联特征,并根据所述关键关联特征和对应存活时间生成训练数据集以训练判读模型; 其中,所述筛选数值化特征中关键关联特征,包括:计算每个数值化特征与病患术后存活时间的高效最大信息系数估计值;筛选所述高效最大信息系数估计值大于第二目标阈值的数值化特征生成关联特征;计算关联特征之间的高效最大信息系数估计值,剔除所述高效最大信息系数估计值大于第三目标阈值的关联特征的任一项生成关键关联特征; 其中,所述判读模型的结构包括:输入层、多层感知机层、输出层和损失函数,其中,所述输入层输入为病患的关键关联特征集;所述多层感知机层包含多个全连接层,每层利用目标函数捕捉关键关联特征之间的非线性关系和线性关系转换为病患术后存活时间的预测概率值;所述输出层用于输出每个关键关联特征对应的病患术后存活时间的预测概率值;所述损失函数用于根据每个关键关联特征对应的病患术后存活时间的预测概率值与每个关键关联特征对应的病患术后实际存活时间计算差异值,并以最小化损失函数为目的优化所述判读模型的参数; 将所述预测结果关联对应的随访数据填充至缺失数据库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军总医院第二医学中心,其通讯地址为:100039 北京市海淀区复兴路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。