Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 广西电网有限责任公司梧州供电局李金灿获国家专利权

广西电网有限责任公司梧州供电局李金灿获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉广西电网有限责任公司梧州供电局申请的专利一种基于改进TF-IDF的客户用电安全智能分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115982349B

龙图腾网通过国家知识产权局官网在2025-08-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211525623.1,技术领域涉及:G06F16/353;该发明授权一种基于改进TF-IDF的客户用电安全智能分类方法是由李金灿;王冰;黄燕;刘祥吉;杨霞琴;张君;李佩;梁耀元;陈远设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。

一种基于改进TF-IDF的客户用电安全智能分类方法在说明书摘要公布了:本发明提供了一种基于改进TF‑IDF的客户用电安全智能分类方法,包括如下步骤:①预处理:将用检工单中的文本内容分为多个类别,并预处理为隐患内容文本数据集;②计算权重:通过改进TF‑IDF方法计算每一个词语的权重;③矩阵化;④建表;⑤生成表示向量;⑥分类;⑦验证。本发明通过提出针对于文本分类的改进TF‑IDF,并与word2vec词向量结合,既能保留语义又可以体现词语的重要性,在输入层和卷积层之间引入了注意力机制,利用注意力机制处理文本向量得到注意力矩阵,具有良好的泛化能力,可以达到更好的分类结果。

本发明授权一种基于改进TF-IDF的客户用电安全智能分类方法在权利要求书中公布了:1.一种基于改进TF-IDF的客户用电安全智能分类方法,其特征在于:包括如下步骤: ①预处理:将用检工单中的文本内容分为多个类别,并预处理为隐患内容文本数据集; ②计算权重:通过改进TF-IDF方法计算每一个词语的权重; ③矩阵化:用word2vec模型将原始文本转换为向量矩阵; 所述步骤③之后,还包括步骤: 结合:将所述步骤②中得到的每一个词语的权重,和所述步骤③中得到的向量矩阵,相结合形成词嵌入; ④建表:基于向量矩阵建立词汇-索引映射表,并和训练的词向量文件进行组合形成.npz文件; ⑤生成表示向量:将训练数据集中的每个词语用词向量表示,并拼接生成文本表示向量; ⑥分类:以文本表示向量作为输入,用卷积神经网络分类模型进行文本分类; ⑦验证:在验证集上运用准确率和F1值作为评估指标,验证模型的有效性; 所述改进TF-IDF方法是TF-IDF-ICP,在TF-IDF的基础上引入类内因子InterC和词距离因子DS,计算公式为: 式中,TF为平均词频,IDF为逆向文件频率; 所述TF-IDF-ICP的具体计算步骤为: 1)计算类内因子,首先统计某一类别j中特征项i在文档d中出现的次数,进而计算特征项i在类别j的标准差,最后对标准差求倒数表示特征项在类内的分布均匀程度; 2)计算词距离因子,统计文本中特征项个数并求出特征词最后出现和首次出现的位置序号之差,然后求差与特征项个数的比值; 3)计算特征项在文档中的平均词频TF,即统计特征项i在类别j所包含文档中出现的总次数; 4)计算逆向文件频率IDF,由总文件数除以包含该词语的文件的数目,再将得到的商取对数得到; 5)将以上计算得到的类内因子,词距离因子、词频和逆词频数值相乘获得特征项权重TF-IDF-ICP。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广西电网有限责任公司梧州供电局,其通讯地址为:543000 广西壮族自治区梧州市西环路中段1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。