基于大数据技术的消费信贷客户数据挖掘应用实践研究

来源 | 中国银行业协会
作者 | 中国邮政储蓄银行 消费信贷部课题组(李静姝、秦维维、金婷、黄文贤、冯晓菲)

数字经济新业态新模式的创新发展,将激活未来消费市场,成为新的经济增长点。数字化正在重塑银行业商业模式。为加快适应数字经济发展步伐,中国邮政储蓄银行基于大数据技术,构建消费信贷客户画像,实现客户精细化管理。文章借助大数据技术深度挖掘消费信贷客户,重点通过A银行基于大数据技术理论,利用K-means聚类分析法,对A银行消费信贷客户中个人信用消费贷款进行聚类分析,从无贷户中找到与有贷户处于同一水平,为其推荐相应消费信贷产品。以供读者参考。

 一、绪论

(一)研究背景

数字经济新业态新模式的创新发展,将激活未来消费市场,成为新的经济增长点。数字化正在重塑银行业商业模式。A银行迫切需要深度挖掘存量客户价值,实现无贷户向有贷户转化,完善消费贷款业务结构。为加快适应数字经济发展步伐,A银行基于大数据技术,构建消费信贷客户画像,实现客户精细化管理。

(二)研究意义

处在消费升级、“数字经济”大环境下,商业银行对消费信贷客户的有效挖掘与使用,是决定其是否在消费市场立足与发展的关键。当前,A银行客户体验与先进同业存在明显差距,客户体验提升工作任务艰巨。借助大数据技术深度挖掘消费信贷客户,是紧跟数字经济时代步伐的现实选择,是以客户为中心转变经营模式的必然选择,结合客户差异化特征,构建客户画像,是实现数字化转型的有益尝试,更具现实意义。

(三)研究内容及思路

面对A银行数字化转型中存在的存量客户价值挖掘不深入问题,如何从无贷户中挖掘出消费信贷目标客户?如何使用大数据技术进行挖掘?这一问题需要深入研究。

为提升存量客户价值,扩大消费贷款业务规模,适应数字化经济发展步伐,基于大数据技术以及同业先进实践,以客户为中心,按照客户挖掘、客户运营流程,开展消费信贷客户价值挖掘,在挖掘出的消费信贷客户基础上,实施千人千面客户运营。图1为研究路线图。

利用大数据技术,构建客户画像,从客户交易强度、资产两个维度,对存量客户中有贷户进行聚类分析,找到不同客户交易强度以及资产标签,对有贷户进行分层,划分为普惠客户、重要客户以及战略客户。按照有贷户交易强度、资产标签,从无贷户中找到具有相同或相似标签属性的普惠客户、重要客户以及战略客户,为其推荐相应消费信贷产品。然后将机器学习挖掘出来的目标客户白名单与专家经验法白名单进行对比分析,剖析机器学习法和专家经验法异同,持续完善客户价值挖掘方法。

image.png

图1 研究路线图

(四)研究方法及创新点

  1.研究方法

使用机器学习法、标签映射法、对比分析法以及文献研究法四类研究方法。使用聚类分析无监督的机器学习方法,更能够建立有贷户画像,提高无贷户向有贷户转化率。与传统营销相比,营销响应模型能够提高客户营销响应率,提升营销精准度。“看起来像”标签映射法是无贷户向有贷户转化的核心,通过找到无贷户与有贷户共同指标(资产、交易强度),从有贷户中聚类出客户资产以及交易强度的特征,然后映射到无贷户,从而找到潜在目标客群。这种以客户为中心的精确匹配客户的方法,能够帮助我们挖掘出与有贷户相似的无贷户,提高无贷户转化率和营销精准度。

 2.创新点

研究方法创新。同业及咨询公司多使用专家经验法,从风险角度开发无贷户挖掘模型,并将模型部署落地,形成持续的白名单挖掘能力。现有文献围绕负债、结算,从客户交易强度和银行资产两个维度使用聚类方法对客户进行细分。目前很少文献利用聚类分析对资产类尤其是消费信贷业务进行细分。

本课题借鉴亚马逊作法,从资产、交易强度指标两个维度挖掘有贷户特征,然后映射到无贷户挖掘目标客户。不仅找到了无贷户白名单,还为其推荐相应消费信贷产品。更重要的是,针对无贷户进行细分,将其分为普惠客户、重点客户以及战略客户,支持开展差异化营销。研究逻辑清晰、链条完整,这种以客户为中心的无贷户向有贷户转化方法,展示一种全新的无贷户挖掘思路,具有较强实践价值,值得试行。

 二、大数据技术理论研究以及同业实践应用

(一)聚类分析在客户挖掘中的应用

 1.聚类分析概念及特征

聚类分析将样本个体或指标变量按其具体的特性进行分类的一种统计分析方法,主要用于合理的度量事物相似性,寻找合理的分类规则。聚类分析依据数据相似度或相异度而将数据分群归属到数个聚类簇的方法;使得同一群内的数据或个人相似程度大,而各群之间的相似程度小。常用的聚类分析算法包括层次聚类分析、划分聚类分析、以密度为基础和以模型为基础的聚类方法。根据分类对象的不同,分为Q型和R型聚类分析两大类。Q型聚类分析也称样本聚类分析,对样本进行分类处理;R型聚类分析也称指标聚类分析,对指标进行分类处理。前者用的统计量是距离系数,距离系数的定义很多,如欧式距离、极端距离、绝对距离等;后者用的统计量是相似系数,相似系数的定义也很多,如相关系数、列联系数等。

聚类分析的方法较多,常用的是系统聚类法和逐步聚类法。逐步聚类法中最常用是K均值聚类法。K均值聚类法是麦奎因提出,这种算法的要点先确定 K 值,然后将数据集划分成 K类,并反复迭代,把每一个样本重新分配到距离其最近的中心所属类别中。K均值聚类法的目标是使每个数据到数据点所属聚类中心的总距离变异平方和最小。

K均值聚类(K-Means)优点在于计算量小,处理速度快,适合大样本的聚类分析;是发现异常值的有效方法;等价于通过循环使得达到最小值。缺点是需要操作者先给出要分类最可能的数目 K,不同的初始值往往会产生不同的聚类结果,需要从中找出最优的分类结果;该算法不适合用于发现数据分布形状非凸的类别或者内部存在极大的大小差别的类,它对“噪声”和孤立点数据存在特别大的敏感性;可能收敛到局部最小值,在大规模数据集上收敛较慢。

聚类分析常用于个人客户(李玲等,2009)、企业客户细分(金培鑫,2010),评估银行盈利能力(陈晓晓,2012)、财务绩效(鲁婧文、刘轩宇,2013)、流动性(王国跃、周陈曦,2009)等。

 2.同业应用实践

美国企业在大数据应用方面领跑,中国企业跟跑。在美国企业大数据应用实例中,应用最广泛的是购物网站商品推荐。美国购物平台亚马逊(Amazon)在大数据应用做法如下:第一步收集分析顾客相关信息,第二步建立细分顾客群体类别,第三步分析推荐商品匹配组合,第四步打造网上个性化商店。亚马逊如何建立顾客细分,在对每一位顾客行为数据进行分析的基础上,亚马逊开发聚类分析模型对相似购买群体进行分类,目标是把每一个顾客分配到与他最为相似的已有顾客细分群中,结合该群体的购买历史与商品评价,生成商品推荐列表,并将其推荐给顾客。

B银行、C银行、D银行以及E银行等先进零售银行基于大数据技术挖掘存量客户价值,为白名单客户提供预授信,发放线上互联网贷款。B银行的B产品、C银行的C产品是A银行消费信贷客户价值挖掘重点学习的金融产品。

B银行利用积淀的万余条多小微企业、超亿条的数据信息,构建授信风控模型,迭代优化小微企业评分卡,创建其独有的信贷客户评价流程及模式,推出了B模式。该业务仅面向在B银行有过交易记录的企业及企业主,基于客户的资产或信贷或者其他相关产品服务数据,挖掘出潜在的客户,并测算其授信额度,进行预授信。不仅提升营销的效率,也极大地优化客户体验。B产品是B银行依据企业或企业主个人的金融资产、按揭房贷情况及信用情况等各项数据,测算意向授信额度,向小微企业发放的、全程在线的流动资金贷款。

C银行利用大数据技术创新推出C产品。C产品是通过对行内零售客户的内、外部数据整合和应用,精准定位客户贷款需求,为客户提供全线上、全自助的贷款服务。该产品是面向个人客户发放的个人网络贷款业务,支持借款人经营实体流动资金周转或综合消费。客户挖掘方面,在C产品预授信阶段,系统就会收集大量客户数据,包括客户贷款历史数据、各类交易数据、外部资信数据、信用卡使用情况、家庭资产状况等,汇总各类数据,形成一套综合评定体系,通过客户画像,最终选出满足授信条件的优质客户。

(二)结论

A银行基于大数据技术开展消费信贷客户价值挖掘,应学习B银行B产品、C银行C产品经验作法,利用聚类分析这种无监督机器学习来分析建模,对客户价值进行细分,将客户细分结果实时融入到其业务流程中,再利用营销响应模型这种有监督的机器学习模型提升客户响应率,为客户提供千人千面个性化推荐和服务。

聚类分析中K-means是一种使用非常广泛的聚类方法,能够将数据群体合理、自动、迅速划分成 K 个子群体,比较适合解决大量客户数据信息的客户细分问题。该方法比较适合A银行消费信贷客户价值挖掘,可考虑使用该方法进行客户细分。

 三、A银行基于大数据技术的消费信贷客户价值挖掘

本章以机器学习方法为主,专家经验方法为辅,共同对存量消费信贷客户进行挖掘,对比分析目标客群差异,总结机器学习和专家经验方法优劣势,以便更好开展客户价值挖掘。重点从有贷户资产以及交易强度进行聚类分析,构建有贷户画像,映射到无贷户,从无贷户中找到有潜在消费信贷需求的目标客户。

(一)基于有贷户聚类分析的消费信贷客户价值挖掘

 1.研究思路

为深度挖掘A银行无贷户价值,促进无贷户向有贷户转变,需找到无贷户与有贷户都有的且代表客户资产、交易强度、客户属性的指标例如资产、收入、持有金融资产数量、消费频次、婚姻状况、学历等,通过聚类分析刻画有贷户画像,再从有贷户映射到无贷户,识别与有贷户具有相似或相同特征的潜在消费信贷客户。

围绕交易强度以及资产两个维度,将无贷户中潜在消费客户按照营销先后顺序分三类,一类是普惠客户,交易强度、资产与大多数有贷户处于同一水平,为交易强度适中、资产水平适中的客户;一类是重点客户,在现有交易强度水平基础上,适当提升客户资产水平,为交易强度适中、资产中级以上的客户;一类是战略客户,交易强度中强,为A银行粘性客户,转化成为消费信贷客户的概率大。针对无贷户分层,分步制定差异化营销策略,提高营销针对性以及客户转化率。

 2.指标定义及选择

客户资产体现客户对A银行效益的价值贡献,衡量指标有资产、收入等。客户交易强度反映客户在A银行交易频次以及持有金融产品数量的指标,包括但不限于消费频次、转入转出次数、持有金融产品数量、信用卡使用频次、ETC支付次数等。客户资产以及交易强度交易指标是银行拥有的关键客户指标,无论是有贷户还是无贷户都有。

本着可用的原则,删除高缺失值指标后,最终用季日均金融资产余额、年收入、最近一年活期流水转入金额、转出金额四个指标衡量客户资产,用季日均持有金融资产个数、最近一年活期流水转入次数、转出次数三个指标衡量交易强度;客户属性方面,选择与资产或交易强度密切相关的婚姻状况、教育程度、城市分布以及区域分布。

 3.聚类分析过程

在对数据进行标准化处理之后,采用K平均值法(K-means method)方法,从客户资产以及交易强度两个维度进行聚类分析。

K-means算法是最常见的聚类算法,算法的目的是选择出质心,使各个聚类内部的inertia值最小。图2、图3横坐标是聚类个数,纵坐标是inertia_score,图2是交易强度聚类分析inertia_score图,图3是资产聚类分析inertia_score图。inertia_score是评估K-means簇的个数是否合适指标,可以被认为是类内聚合度的一种度量方式,距离越小说明簇分的越好,一般选取临界点的簇个数。从图2交易强度和图3资产inertia_score变化图可以看出,选择聚类簇个数5次较为合适。

image.png

图2 交易强度聚类分析inertia score图

image.png

图3 资产聚类分析inertia score图

 4.聚类结果分析

交易强度按照从弱到强排序分为5档,有弱、中、中强、强以及超强,资产水平从低到高排序分为5档,有低、中、中高、高以及超高。

聚类分析根据客户占比,将有贷户分为三类客户,包括普惠客户、重点客户以及战略客户。普惠客户是消费信贷的主要客群,占比高,资产水平适中、交易强度适中。重点客户是能够为A银行带来高收益的客户,交易强度适中但资产水平中高。战略客户是决定A银行消费信贷发展方向,起决定性作用的客户,粘性大、交易强度中强。

有贷户主要是中交易强度、低资产和中交易强度、中资产两类客户,占比近70%,还有部分弱交易强度,中低资产的客户,均为普惠客户。有贷户占比最大的中交易强度客户中的中高资产以上群体以及排名第二的中强交易强度客户中的中高资产以上群体占比逐渐增大,将其定义为重点客户。要重点提升现有中高资产客户占有率,增加银行收益同时防范信用风险。超强交易强度的客户粘性强,为A银行战略客户。要加大资源配置支持战略客户,完善消费信贷产品要素,为其提供高额度、低利率的具有竞争力的消费信贷产品。

 5.无贷户挖掘结果

将有贷户划分为普惠客户、重要客户和战略客户三类,刻画出相应客户资产以及交易强度,然后映射到无贷户,从中找出具有相同特征的客户。存量客户中,近1/3客户是消费信贷潜在客户,与现有存量客户处于同一资产、交易强度水平。

针对无贷户分层结果,建议分阶段实施差异化营销策略。短期看,重点营销普惠客户,使其成功转化成有贷户。长期看,密切关注交易强度超强客户,为其提供个性化信贷服务。

(二)基于专家经验的消费信贷客户价值挖掘

 1.研究思路

同业多使用专家经验法挖掘存量客户,以信用风险为核心,从授信政策、人行风险相关指标角度,制定白名单预授信规则,在存量客户中找到满足预授信准入条件的客户。

 2.机器学习与专家经验对比分析

对比机器学习法与专家经验法发现,两者挖掘对象不同,虽然均挖掘有贷户,机器学习法从无逾期的无贷户中挖掘目标客户,专家经验法则是从个人信用消费贷款客户中寻找目标客户。两者挖掘逻辑不同,机器学习法从交易强度和资产两个维度构建有贷户画像,映射到无贷户,从无贷户中找到具有相同或相似特征的客户。而专家经验法以风险为核心,从授信政策角度和基本业务逻辑角度,制定预授信政策,从无贷户中筛选出满足预授信条件的客户。

机器学习中聚类分析法与专家经验法虽然对象不同,逻辑不同,但资产、收入是两种方法都用到的指标。以资产、收入为切入点,对两种方法挖掘的白名单客户进行对比分析。通过对比发现,专家经验法白名单客户中既有资产也有收入的客户10万余户。根据聚类分析结果,消费信贷客户多为交易强度适中客户,由于专家经验法挖掘白名单时未考虑交易强度指标,在将专家经验法挖掘出的白名单客户默认为普遍具有适中交易强度特征后,重点考察专家经验法白名单客户资产。

从季日均金融资产余额指标看,专家经验白名单客户属于机器学习中的战略客户。收入方面,专家经验白名单中31.12%的客户属于中高资产以上客户,为机器学习中的A产品重点客户;超2/3专家经验白名单客户为中资产以下客户,是机器学习中的A产品普惠客户。

通过对比发现,从个人信用消费贷款中挖掘出来的专家经验白名单客户中,与聚类分析处于同一资产水平的普惠客户占比2/3,重点客户占比1/3。而A产品无贷户挖掘结果显示,从无贷户中挖掘出来的聚类分析A产品客户占比1/2,也就是说无贷户中有50%客户为A产品目标客户。这表明,专家经验法与聚类分析法挖掘出来的A产品白名单客户具有相同资产特征,是与A产品客户处于同一资产水平的中资产以下客户。不同的是,专家经验白名单客户重点客户占比(31.12%)占比高于机器学习A产品白名单占比(0.28%),因为专家经验法更看重客户资产,而聚类分析除客户资产外,侧重客户交易强度。

(三)结论

基于数据挖掘相关理论,从交易强度和资产两个维度,利用K-means聚类分析法对A银行消费信贷客户进行聚类分析,并将聚类结果映射到无贷户,从无贷户中找到与消费信贷客户处于同一水平,具有相同交易强度、资产的客户,推荐消费信贷产品。聚类结果显示,消费信贷客户多为资产适中、交易强度适中。从无贷户中寻找与有贷户具有相同特征的客户发现,近1/3客户是消费信贷客户,即普惠客户。在原有客户基础上,提升现有客户资产水平,将其作为重点客户来营销;拓展交易强度中强的客户,将其作为战略客户来维护。从无贷户中挖掘出重点客户、战略客户时,发现战略客户比重点客户多。

将聚类分析法与专家经验法进行对比分析,找出两种方法异同,并对两者挖掘出来的无贷户名单进行匹配。结果发现,虽然两种方法研究对象不同,逻辑不同,聚类分析以客户为中心,侧重资产、交易强度,专家经验更偏重风险,但两种方法异中有同,挖掘出来的客户资产具有相同特征,即是与A产品客户处于同一水平的资产适中客户。

四、商业银行消费信贷客户价值挖掘实施思路与建议

(一)实施思路

基于大数据技术,挖掘出消费信贷目标客户,并进行分层,为其推荐相应消费信贷产品。下一步商业银行要在此研究基础上,以客户为中心,建立一套信用风险评分模型,建立反欺诈模型,确定不同产品无贷户白名单,测算授信额度,进行预授信。

(二)实施建议

 1.以客户中心,打造金融服务新模式

“以客户为中心”,坚持客户至上,需充分了解客户关切、满足客户要求,紧紧围绕客户,建立一套新的指标来衡量经营绩效,从关注传统的产品盈利性、当前销售、品牌资产、市场份额等指标向客户生命周期、客户资产、客户交易强度、客户资产份额新方式转变,尤其关注客户交易强度、客户资产,不断增强客户交易强度,提高客户资产,优化客户体验渠道。

 2.扩大目标客群,提升客户质量

研究发现,A银行消费信贷客户交易强度适中,资产适中。研究显示,激活沉默客户的成本仅相当于获取一个新客户成本的十分之一。因此,要激活交易强度适中客户,培养高资产客户,维护高资产、强交易强度客户。实现这一目标,针对有贷户和无贷户需差别对待,实施差异化营销策略,扩大目标客群,提升客户质量。

 3.升级消费信贷产品,强化产品品牌影响力

随着数字经济的迅速发展,数字资源成为银行未来的核心竞争力,也是产品研发的重要因素。建议完善数据共享机制,提高结构化数据填报质量,增加数据可利用率,增加行为数据、第三方等数据维度,丰富数据维度,基于大数据创新研发新产品,强化消费信贷产品品牌影响力。

 4.创新数据挖掘模型和技术,提升大数据挖掘能力

科技和互联网的发展正在给消费市场带来新的变化,同时也对金融服务提出新的要求。除基于大数据技术以外,商业银行还可借助人工智能、5G技术挖掘消费信贷客户。除聚类分析以外,要使用有监督的学习模型继续挖掘白名单客户,使用逻辑回归更多地模型进行营销响应模型预测,确保机器学习结果的稳定性。

版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:JRwenku8),谢谢!

(0)
上一篇 2023年11月10日 下午4:35
下一篇 2023年11月24日 上午9:15

相关推荐