湖南三湘银行股份有限公司文博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉湖南三湘银行股份有限公司申请的专利银行可疑交易特征自动识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119671698B 。
龙图腾网通过国家知识产权局官网在2025-09-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510181285.1,技术领域涉及:G06Q40/02;该发明授权银行可疑交易特征自动识别方法及装置是由文博;张春阳;杨成林;张德文;周可彬;谭林设计研发完成,并于2025-02-19向国家知识产权局提交的专利申请。
本银行可疑交易特征自动识别方法及装置在说明书摘要公布了:本发明公开了一种银行可疑交易特征自动识别方法及装置。收集银行交易记录,并对记录中的文本进行标准化处理,处理内容包括转账、消费、ATM取现等常见交易类型。然后,对标准化后的文本进行分词处理,提取关键信息词汇,并构建词汇表,该词汇表用于后续的Word2Vec模型训练。Word2Vec模型采用Skip‑Gram架构,通过预测上下文词来训练生成词向量,捕捉交易特征词汇之间的语义关系,并采用负采样方法减少模型计算量。训练过程中使用最大对数似然函数作为损失函数,优化模型参数。训练完成后,通过验证生成的词向量评估模型对可疑交易特征的识别精度,并根据验证结果进一步调整模型参数,以获得更准确的可疑交易识别模型。
本发明授权银行可疑交易特征自动识别方法及装置在权利要求书中公布了:1.一种银行可疑交易特征自动识别方法,其特征在于,包括: 收集银行交易记录,并对交易记录中的文本进行标准化处理;其中,所述交易记录包括转账、消费、ATM取现、柜面取现、购买理财、购买贵重金属及贷款记录;所述标准化处理,包括日期格式统一、金额单位规范化、去除非文本符号; 对标准化处理后的交易记录中的文本进行分词处理,提取关键信息词汇;根据所述关键信息词汇,构建词汇表;其中,所述词汇表包括反映交易特征的词汇,用于后续的模型训练; 使用交易记录中文本的分词处理结果,并结合构建的词汇表,对Word2Vec模型进行训练;其中,所述Word2Vec模型采用Skip-Gram模型架构实现,对于给定交易记录文本中的中心词,Skip-Gram模型通过预测其上下文词来训练生成词向量,以捕捉词语之间的语义关系;其中,每个上下文词的出现概率根据如下的公式1计算: 其中,表示中心词,表示上下文词,其中,表示中心词在句子中的位置,表示上下文相关的索引;表示上下文词的词向量;表示中心词的词向量;表示词汇表中的每一个词的词向量;是泀汇表的大小; 采用负采样方法对Word2Vec模型进行训练,其中,所述负采样方法通过随机选择与中心词不相关的词作为负样本,减少模型对所有词汇进行预测的计算量;其中,训练过程中使用如下公式2提供的损失函数: 其中,表示损失函数,用于衡量模型在训练过程中的预测误差;表示训练数据中的总样本数;表示窗口大小;表示上下文词的词向量;表示中心词的词向量;表示负样本的总数量;表示从负样本分布中随机采样选取负样本的概率期望值;表示负样本的词向量;是sigmoid函数; 训练完成后,对生成的词向量进行验证,评估Word2Vec模型识别交易特征的精确度; 根据Word2Vec模型的验证结果,调整Word2Vec模型的模型参数,获得能够识别出银行可疑交易特征的调整后Word2Vec模型; 其中,所述对标准化处理后的交易记录中的文本进行分词处理,提取关键信息词汇,包括: 通过自然语言处理工具对交易记录文本进行语法分析,识别出每个词汇的词性,并根据上下文窗口技术捕捉中心词及其相关上下文词汇,确保每个词汇在其语境中获得准确的语义关联; 根据交易场景中的上下文词汇,动态过滤掉无关或噪声词汇; 结合金融交易的特征词汇表,在词汇过滤后优先提取资金流动相关词汇; 根据历史可疑交易记录中的高风险特征词汇,对提取的资金流动相关词汇进行加权处理,增强在后续模型训练中的重要性; 其中,所述根据历史可疑交易记录中的高风险特征词汇,对提取的资金流动相关词汇进行加权处理,包括: 根据如下的公式4,计算资金流动相关词汇的历史数据权重: 其中,表示资金流动相关词汇在历史可疑交易记录中出现的次数;表示历史可疑交易记录中的总词汇数; 根据银行内部定义的风险级别,使用以下公式5计算修正后的词汇权重: 其中,是风险修正系数;为银行内部为资金流动相关词汇分配的风险级别,风险级别值由0到1之间取值,表示从低风险到高风险的程度; 结合交易记录中的时间特征,根据如下的公式6对词汇权重进行进一步调整,获得时间衰减权重: 其中,表示当前交易发生的时间戳;为参考时间点,包括可疑交易集中的高风险时间段;是时间衰减系数,用于衡量时间对词汇重要性的影响; 在考虑历史权重、风险修正和时间衰减后,使用如下公式7计算最终的词汇权重: 其中:是控制风险与时间的调整系数;是校正项,用于控制在特定情况下的平滑效果,防止权重过度偏高;是非线性调整指数,用于调整在极端情况下的加权效果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南三湘银行股份有限公司,其通讯地址为:410200 湖南省长沙市岳麓区潇湘北路三段1207号三银商业中心A栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。