山东达创网络科技股份有限公司林舟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东达创网络科技股份有限公司申请的专利企业违规风险预测模型的训练方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119622525B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510147438.0,技术领域涉及:G06F18/2415;该发明授权企业违规风险预测模型的训练方法及相关装置是由林舟;孙涛;宋颜宁;王昌成设计研发完成,并于2025-02-11向国家知识产权局提交的专利申请。
本企业违规风险预测模型的训练方法及相关装置在说明书摘要公布了:本发明提供一种企业违规风险预测模型的训练方法及相关装置,方法包括:获取企业合同数据,并将企业合同数据输入已预先训练的企业合同数据扩充模型,得到扩充合同数据;组合企业合同数据与扩充合同数据,得到第一合同样本集合;采用已预先训练的特征提取模型对第一合同样本集合进行特征提取,得到第一合同样本集合中各合同样本的合同特征;按照合同样本的风险类型,对应标注合同特征,并且,组合完成标注的全部合同特征得到训练特征集合;采用训练特征集合对分类模型进行训练,得到企业违规风险预测模型;本发明能够训练得到对企业合同风险进行高准确度判定的企业违规风险预测模型。
本发明授权企业违规风险预测模型的训练方法及相关装置在权利要求书中公布了:1.一种企业违规风险预测模型的训练方法,其特征在于,包括: 获取企业合同数据,并将所述企业合同数据输入已预先训练的企业合同数据扩充模型,得到扩充合同数据; 组合所述企业合同数据与所述扩充合同数据,得到第一合同样本集合; 采用已预先训练的特征提取模型对所述第一合同样本集合进行特征提取,得到所述第一合同样本集合中各合同样本的合同特征;按照所述合同样本的风险类型,对应标注所述合同特征,并且,组合完成标注的全部所述合同特征得到训练特征集合; 采用训练特征集合对分类模型进行训练,得到企业违规风险预测模型; 其中:所述企业合同数据扩充模型根据基于双重判别器生成的对抗网络算法模型训练得到;所述特征提取模型根据多维声波蝙蝠优化的神经网络模型训练得到; 所述特征提取模型的训练方法包括: 在多维声波调制环节,根据距当前时刻的最近一次训练迭代后的所述神经网络的性能,对所述神经网络中每个参数的声波属性进行修正处理; 所述修正处理的表达式如下: 式中,为所述神经网络中的参数在第次迭代时的频率;为所述神经网络中的参数在第次迭代时的频率;为所述神经网络的损失函数关于权重参数的偏导数;为所述神经网络的损失函数;为频率调整率;为所述神经网络中的参数在第次迭代时的频率更新增量; 企业合同数据扩充模型的训练流程包括: 1)初始化生成对抗网络的生成器和判别器的网络参数,设为生成器的初始参数,为判别器的初始参数,初始化的方式为随机初始化,且,初始化的参数服从于均值为0、方差为单位矩阵的正态分布; 2)对输入噪声进行自适应调整,从第2次迭代开始判别器通过监控上一次迭代生成企业合同数据的质量动态修正噪声向量,表示为: 依据该梯度实现对噪声向量的更新,计算方式表示为: 式中,为判别器损失关于噪声向量的梯度计算函数,为第次迭代时的噪声向量,噪声向量是生成对抗网络中输入给生成器的一组随机数,用于引导生成器创造多样化且与真实数据分布相似的合成数据;为判别器的参数,为第次迭代时的噪声向量,为针对噪声向量更新的学习率,为判别器函数,为生成器函数,为判别器对真实与生成企业合同数据做出真伪判别的损失函数,为偏导数符号,为二分类标签,真实企业合同数据标签为1,生成企业合同数据标签为0,设置为0.3; 3)将生成企业合同数据与真实企业合同数据进行混合,计算方式表示为: 式中,为混合后的企业合同数据,为生成器生成的企业合同数据,为真实企业合同数据,为混合比例参数,设置为0.3; 4)对生成企业合同数据的拓扑特征进行分析和验证,所述拓扑企业合同数据分析方法依据Wasserstein距离计算拓扑损失函数,计算将生成器生成企业合同数据的概率分布转化为真实企业合同数据的概率分布所需的最小代价,也即找到生成器生成企业合同数据和真实企业合同数据分布之间的最优映射,计算方式表示为: 结合拓扑损失对生成器进行更新,更新方式表示为: 式中,为计算Wasserstein距离的函数,为概率密度函数ProbabilityDensityFunction,作用是表征生成的数据和真实数据的分布,具体通过对数据样本进行核密度估计KernelDensityEstimation,KDE来估计分布的概率密度,为拓扑损失,为平衡生成企业合同数据常规质量与拓扑质量的超参数,为第次迭代时的生成器的参数,为第次迭代时的生成器的参数,表示关于生成器参数的梯度,为生成器更新的学习率,为生成器的真实性损失函数,设置为0.3,设置为0.01; 5)利用两个判别器实施双重判别过程,通过第一个判别器判断企业合同数据真伪,第二个判别器判断企业合同数据类别分布,采用KL散度度量真实类别分布与生成企业合同数据类别分布的差异,计算方式表示为: 依据类别分布的KL散度提升判别效果,计算方式表示为: 式中,为判别器关于企业合同数据真伪的损失函数,为判别器平衡系数,为判别器关于类别判别的损失函数,为类别总数,为正整数,为真实类别分布在第个类别上的概率,为判别器预测类别分布在第个类别上的概率,设置为0.3; 6)在生成器的损失函数中采用特征匹配约束,计算方式表示为: 式中,为生成器的真实性损失函数,为生成器的中间层用于提取企业合同数据中间特征的操作;为L2范数,用于衡量特征差异程度; 7)基于双重判别器的反馈,动态优化生成器和判别器的训练策略,依据对判别器真伪和类别损失的监控,实现对判别器参数的更新,计算方式表示为: 式中,为判别器参数,为迭代次数,为判别器更新的学习率,为损失函数对判别器参数的梯度,为第次迭代时的判别器的参数,为第次迭代时的判别器的参数,设置为0.3; 8)重复迭代上述步骤,直至满足预设的停止迭代条件,即表示模型训练完成,预设的停止迭代条件为达到预设的最大迭代次数,预设的最大迭代次数设置为1000次。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东达创网络科技股份有限公司,其通讯地址为:250000 山东省济南市中国(山东)自由贸易试验区济南片区天辰路联合财富广场1号楼1301-1室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。