Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆电信系统集成有限公司杨若浩获国家专利权

重庆电信系统集成有限公司杨若浩获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆电信系统集成有限公司申请的专利一种基于金融大数据的企业风险智能识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115293641B

龙图腾网通过国家知识产权局官网在2026-03-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211036211.1,技术领域涉及:G06Q10/0635;该发明授权一种基于金融大数据的企业风险智能识别方法是由杨若浩;刘惠强;徐明禹;付煜翀;颜小波;胡明俊;钟波设计研发完成,并于2022-08-27向国家知识产权局提交的专利申请。

一种基于金融大数据的企业风险智能识别方法在说明书摘要公布了:一种基于金融大数据的企业风险智能识别方法,步骤如下:1判断是否需要训练聚类中心和决策树;2数据采集,获取企业的工商数据、法务数据、类别数据,生成高风险数据集、低风险数据集;3数据预处理,将两个数据集中的数据拆分为高风险工商数据、法务数据、类别数据矩阵,低风险工商数据、法务数据矩阵、低风险矩阵、类别数据矩阵;4数据聚类,构建K‑Means模型,对高风险工商数据矩阵、高风险法务数据矩阵分别训练聚类中心;5提取非线性特征:得到高风险特征矩阵和低风险特征矩阵;6构建决策树,基于高风险特征矩阵和低风险特征矩阵构建决策树模型;7识别企业风险,加载决策树模型,得到安全风险分析结果。

本发明授权一种基于金融大数据的企业风险智能识别方法在权利要求书中公布了:1.一种基于金融大数据的企业风险智能识别方法,其特征在于步骤如下: 1判断是否需要训练聚类中心和决策树,若不需要,则直接采集企业数据进行企业风险识别,若需要,则进入下一步; 所述判断是否需要训练聚类中心和决策树的方法如下, 1-1设定模式mode=1表示预测企业风险,distName='refinedCosine'表示基于修正余弦相似度训练聚类中心,trnCentre=0表示不重新训练聚类中心,pickCentre=1表示选取更少的中心进行特征提取,trnTree=1表示重新训练决策树; 1-2当trnCentre=0,refineCentre=1,distName='refinedCentre'时,查看保存聚类中心的文件夹内,若没有训练好的聚类中心,则需要重新训练聚类中心和依赖于聚类中心的决策树; 2数据采集,从网站中获取企业的工商数据、法务数据、类别数据,并将已注销企业注销前1~2年的数据存于高风险数据集dfAcc中,将5年以上未注销企业的数据存于低风险数据集dfNorm中; 3数据预处理,删除高风险数据集dfAcc和低风险数据集dfNorm中全为0或数据不完整的无效数据,并通过分别对两个数据集中的工商数据和法务数据进行极差标准化,将两个数据集中的数据拆分为高风险工商数据矩阵、高风险法务数据矩阵、高风险类别数据矩阵、低风险工商数据矩阵、低风险法务数据矩阵、低风险类别数据矩阵; 所述数据预处理的具体步骤如下, 3-1删除高风险数据集dfAcc和低风险数据集dfNorm中重复、不完整、全为0和注册资本为0的数据; 3-2将高风险数据集dfAcc横向拆分为高风险的不含注册资本的非类别数据矩阵dataAcc和类别数据矩阵TypeAcc,并将低风险数据集dfNorm横向拆分为低风险的不含注册资本的非类别数据矩阵dataNorm和类别数据矩阵TypeNorm; 3-3将高风险的不含注册资本的非类别数据矩阵dataAcc和低风险的不含注册资本的非类别数据矩阵dataNorm中的每个元素分别除以同一行的注册资本项,得到两组高风险、低风险数据矩阵; 3-4根据高风险的不含注册资本的非类别数据矩阵dataAcc中各项数据的极差d和最小值m,对步骤3-3得到的两组数据矩阵进行极差标准化,公式如下: ; 式中,表示高风险或低风险数据矩阵的极差标准化,表示j项数据项的最小值,表示j项数据项的极差; 3-5按数据项类别对步骤3-4经极差标准化的数据矩阵进行拆分,得到高风险工商数据矩阵、高风险法务数据矩阵、高风险类别数据矩阵、低风险工商数据矩阵、低风险法务数据矩阵、低风险类别数据矩阵 4数据聚类,构建K-Means模型,采用高风险工商数据矩阵、高风险法务数据矩阵分别训练聚类中心,并按高风险工商数据矩阵、高风险法务数据矩阵、低风险工商数据矩阵、低风险法务数据矩阵在聚类结果中的相异度来确定聚类数; 数据聚类的具体方法如下, 4-1设定要枚举的聚类中心数范围k1、k2,枚举聚类中心数k,使其满足,并在高风险工商数据矩阵和高风险法务数据矩阵中分别随机选取k个数据点作为初始聚类中心 4-2基于修正余弦相似度作为距离度量方法,将距离非线性映射到0,1,分别获得高风险工商数据距离矩阵和高风险法务数据距离矩阵,其中,高风险工商数据距离矩阵的计算公式如下: 式中,distAcc表示高风险工商数据距离矩阵,表示distAcc第i行第j列的元素,表示distAcc第i行第l列的元素,表示dataCorpAcc第l列的平均值,表示第j行第l列的元素; 高风险法务数据距离矩阵的计算公式原理同高风险工商数据距离矩阵; 4-3将各距离矩阵中的每个点划到距离最近的聚类中心所代表的类,用每一类的平均值更新聚类中心,并循环进行步骤3-2、3-3; 4-4当聚类情况不在变化或循环次数达到上限,则将当前的聚类中心保存为局部最优聚类中心; 4-5分别获取高风险企业数据集和低风险企业数据集按照局部最优聚类中心cen的分类情况:,表示属于第i类的数据点个数,分别保存到高风险数据集中分别属于各类的数据点数目、低风险数据集中分别属于各类的数据点数目; 4-6根据、计算皮尔逊相关系数,计算公式如下, ; 若,初始值为1,则将局部最优聚类中心保存为最优聚类中心,并将保存为当前的; 若,则保持聚类中心不变; 5提取非线性特征: 5-1根据步骤3获取的两组高风险非类别数据集,分别从高风险工商数据矩阵、高风险法务数据矩阵中筛选出4个表现差异超过阈值或者差异最大的聚类中心; 5-2计算各组数据距离对应聚类中心的修正余弦相似度,得到高风险的工商数据距离矩阵、法务距离矩阵和低风险的工商数据距离矩阵、法务距离矩阵; 5-3将高风险的工商数据距离矩阵、法务距离矩阵与高风险类别数据矩阵进行横向合并,得到高风险特征矩阵chAcc和低风险特征矩阵chNorm; 6构建决策树,基于高风险特征矩阵chAcc和低风险特征矩阵chNorm构建决策树模型; 构建决策树模型时,采用基尼系数法计算信息增益,在选择节点参数时选用信息增益最强的一组特征进行分支,并使用最小支持度的后剪枝策略进行剪枝; 7识别企业风险,加载决策树模型,对获取的非线性特征进行分类,得到安全风险分析结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆电信系统集成有限公司,其通讯地址为:400042 重庆市渝中区大坪正街51号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。