逸思长天(南京)数字智能科技有限公司郭晨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉逸思长天(南京)数字智能科技有限公司申请的专利一种基于频率GINI系数的时序数据特征提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474812B 。
龙图腾网通过国家知识产权局官网在2025-10-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411524234.6,技术领域涉及:G06F18/213;该发明授权一种基于频率GINI系数的时序数据特征提取方法是由郭晨;黄锦槟设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。
本一种基于频率GINI系数的时序数据特征提取方法在说明书摘要公布了:本发明涉及人工智能技术领域,具体为一种基于频率GINI系数的时序数据特征提取方法,包括以下步骤,获取传感器采集的输入数据流,提取数据流中的特征参数,记录每个特征参数在每个时间点的数值,整理每个特征参数的时间序列数据,获取特征参数集。本发明通过引入标准GINI系数为核心的自动化特征工程方法,提升了数据预处理的效率和精度。利用GINI系数计算和阈值设定,能够识别和标记数据中的异常特征,减少了因数据异常引起的误差。此外,自动化的特征参数标记和异常隔离操作减少了对专家干预的依赖,提高了处理大数据集的能力。不仅加速了特征工程的处理流程,也提高了模型的泛化能力,因为它可以连续不断地适应新的数据输入。
本发明授权一种基于频率GINI系数的时序数据特征提取方法在权利要求书中公布了:1.一种基于频率GINI系数的时序数据特征提取方法,其特征在于,包括以下步骤: 获取传感器采集的输入数据流,提取数据流中的特征参数,提取特征X、特征Y、特征Z和特征W,记录每个特征参数在每个时间点的数值,整理每个特征参数的时间序列数据,获取特征参数集; 计算所述特征参数集中每个特征参数的分布频率,统计每个特征参数在每个取值范围内的出现次数,计算每个取值范围的频率值,得到特征分布集; 基于所述特征分布集,计算每个特征参数的标准GINI系数,对每个特征参数,按照取值从小到大排序,计算累计分布频率,再根据累计分布频率计算GINI系数,生成特征GINI系数集; 设定GINI系数阈值范围,比较特征GINI系数集中的GINI系数值与阈值范围,对每个特征参数,判断其GINI系数是否超出阈值范围,若超出,则将特征参数标记为异常,获取异常特征参数集; 针对所述异常特征参数集,执行数据修正、警报触发和数据点隔离操作,修正异常特征参数的数值,触发警报信息,隔离异常数据点,得到处理后特征集; 其中,所述特征分布集的获取步骤为: 从所述特征参数集中获取每个特征参数的时间序列数据,得到每个特征的时间序列数据集; 计算特征参数在每个取值范围内的出现次数,得到每个特征的频率分布数据; 根据每个特征的频率分布数据,采用公式: ; 计算每个取值范围的频率值,生成特征分布集;其中代表频率值,是第个取值范围内的出现次数,是取值范围的中心值,是取值的均值,是一个小正数,确保分母非零,是取值的总出现次数,m是特征参数取值范围的总个数; 所述特征GINI系数集的获取步骤为: 从所述特征分布集中提取每个特征的频率分布数据,得到频率分布数据集; 对每个特征参数,按照取值从小到大排序,计算每个特征的累计分布频率,生成累计分布频率集; 基于所述累计分布频率集,采用公式: ; 计算每个特征参数的GINI系数,生成特征GINI系数集;其中代表特征的GINI系数,代表第个数据点的频率值,是数据点的总数,是所有频率值的平均值,是为避免分母为零添加的小量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人逸思长天(南京)数字智能科技有限公司,其通讯地址为:210000 江苏省南京市江北新区研创园华创路72号鲲鹏大厦B座601-2室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励