重庆邮电大学朱生文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆邮电大学申请的专利一种包含相互关系的复杂多标签医疗数据的预处理方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116842374B 。
龙图腾网通过国家知识产权局官网在2025-08-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310603032.X,技术领域涉及:G06F18/214;该发明授权一种包含相互关系的复杂多标签医疗数据的预处理方法及装置是由朱生文;高满;吴鹏设计研发完成,并于2023-05-25向国家知识产权局提交的专利申请。
本一种包含相互关系的复杂多标签医疗数据的预处理方法及装置在说明书摘要公布了:本发明属于数据处理领域,特别涉及一种包含相互关系的复杂多标签医疗数据的预处理方法及装置,方法包括将数据中缺失值大于99%特征和无关项进行删除,并进行0值填充;对于数据集中的数值型特征使用最小熵法进行离散化;对数据集的标签进行聚类,将每个类簇靠近聚类中心的标签作为该类簇的代表标签,并将每个类簇中所有数据的标签更新为对应的代表标签;结合数据特征与标签之间的协同性、相关性、冗余性和动态变化对数据的特征进行选择;将处理后的数据的标签已经选择的特征作为预处理后的数据,完成预处理;本发明为特征选择提供更好的标签子集,可以减少特征选择的计算时间,同时能避免由于标签中的冗余信息导致特征子集选择不准确的问题。
本发明授权一种包含相互关系的复杂多标签医疗数据的预处理方法及装置在权利要求书中公布了:1.一种包含相互关系的复杂多标签医疗数据的预处理方法,其特征在于,具体包括以下步骤: 将数据中缺失值大于99%特征进行删除,删除数据集中与预测无关的采集项,0值填充数据集中的空缺部分; 对于数据集中的数值型特征使用最小熵法进行离散化; 对数据集的标签进行聚类,将每个类簇靠近聚类中心的标签作为该类簇的代表标签,并将每个类簇中所有数据的标签更新为对应的代表标签; 结合数据特征与标签之间的协同性、相关性、冗余性和动态变化对数据的特征进行选择,包括: 其中,Jxi为特征选择函数,候选特征xi对应的特征选择函数的值越大,候选特征xi被选择的可能越高;MIxi;C|S表示特征相关性;MIS;C|xi表示动态特征相关性;MIxi;S|C表示特征冗余性;MIxi;S;C表示特征的协同性;C为代表标签集,ck表示代表标签集中的第k个标签;S已选特征集合; 特征的动态相关性MIS;C|xi的计算包括: 其中,pa,b,c表示候选特征xi的取值为a、已选特征xj取值为b、中心标签ck为c的联合概率;pb|a表示在候选特征xi的取值为a前提下已选特征xj取值为b的概率;pc|a表示在候选特征xi的取值为a的前提下中心标签ck为取值c的概率;pb,c|a表示在候选特征xi的取值为a的前提下已选特征xj取值为b、中心标签ck为取值c的概率; 将处理后的数据的标签已经选择的特征作为预处理后的数据,完成预处理。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆邮电大学,其通讯地址为:400065 重庆市南岸区南山街道崇文路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。