点融app下载,点融云朵商城
在金融信贷领域中,数据是风控体系的最核心元素,无论是策略规则的开发,还是评分模型的建立,都是围绕众多维度数据进行搭建的。在常用数据的系列体系中,多头数据是一类应用价值比较大的维度,在信贷风险识别、用户群体分类等方面具
在金融信贷领域中,数据是风控体系的最核心元素,无论是策略规则的开发,还是评分模型的建立,都是围绕众多维度数据进行搭建的。在常用数据的系列体系中,多头数据是一类应用价值比较大的维度,在信贷风险识别、用户群体分类等方面具有非常好的效果。
多头数据具体是指多头借贷数据(Multiplatform Loan Data), 反映了借款人在两家及以上机构申请借贷的行为,在实际业务中也可以称为多头负债数据。因此,通过用户的多头数据,可以很直观地判断用户后期还款能力的高低,除了欺诈特殊情况外,借款人的申请机构数或借贷金额越多,其还款风险也就越大。
1、多头数据维度
多头数据在实际风控应用中,有多个常用类别维度,包括申请机构数量、借贷成功数量、借贷失败数量、还款成功数量、借贷逾期数量、借贷平台类型、借贷金额、逾期金额等。对于每个类别,根据具体时间窗口又可以进一步构造更多指标,常见的有近1个月、近3个月、近6个月、近12个月、近24个月、历史等维度。现通过多头借贷的申请、放款、还款、逾期四个环节,分别介绍下多头数据的具体字段。
(1)申请环节:
申请多头字段主要根据注册、申请、通过、拒绝等流程节点进行变量构造的,同时围绕行为频次、平台机构又分为两个大的维度,这也是其他阶段字段的共同之处。
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图1 申请多头字段
(2)放款环节:
放款多头字段主要包括放款次数、放款机构数、放款金额、验证码次数等维度,其中放款金额可以进一步区分放款总金额、单笔最大金额、单笔最小金额、单笔平均金额等。对于验证码相关信息,不仅仅在放款阶段具备,在申请阶段也是存在的,因此可以扩展更多维度的验证码通知次数、验证码通知平台数等字段。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图2 放款多头字段
(3)还款环节:
还款多头字段主要从还款提醒次数、还款金额大小、还款成功/失败状态等子维度进行指标构建,其中对于还款金额,可以进一步加工出最大、最小、平均等统计学维度的字段。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图3 还款多头字段
(4)逾期环节:
逾期多头字段主要从逾期金融、逾期时长、逾期还款状态共三个维度进行扩展,对于逾期金融与逾期时长,同样可以采用最大、最小、平均等进行量化;对于逾期还款状态可以包括逾期未还、逾期已还部分、逾期已结清等情况。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图4 逾期多头字段
2、多头数据衍生
从前边介绍可知,多头字段的类别与数量是比较多的,但在实际场景应用中,尤其是风控模型的建立,往往在特征工程阶段,会根据基础变量会进一步衍生加工,从而得到更多维度的字段,不仅有利于模型区分效果的提升,而且可以扩大模型的业务信息维度。
根据前边对多头字段的描述,我们从申请环节多头类型中,选取某一个子维度字段为例(图5),给大家简单介绍下特征衍生加工的常用统计学方法,主要是平均、占比、差分、差比等方式。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图5 特征基础字段
从申请次数、申请被拒绝次数两个子维度,并结合不同时间窗的划分,可以衍生加工出图6所示的新变量,数量是原来基础字段的2倍多。假设在数据建模流程中,初始变量池的字段共有100个,经过特征工程的衍生加工后,可以扩大为300+个字段,这样可以有效提升模型训练拟合的效果。如果基础变量的维度较多,衍生得到具有业务解释性的特征字段会更多,这种思路无论对策略开发,还是模型建立都是非常有意义的。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图6 特征衍生字段
当然,在多头字段的具体使用过程中,难以避免的部分字段的相关性较强,因此需要对变量池的所有字段进行相关性分析,例如pearson、spearman系数等,从中将相关性较强(例如corr>0.7)的特征进行剔除,从而避免最终模型的区分度较差、共线性较强等问题。
3、风控特征应用
在信贷产品的风控体系中,主要由策略与模型两个模块构成,对于每个模块的架构,都需要根据特征变量的逻辑进行搭建。对于多头字段的应用,同样适用于或策略或模型的开发。由于多头借贷数据的业务特殊性,可以直观反映出用户的风险信息,因此多头字段在很多金融机构的实际业务场景中,会优先考虑将其作为策略规则字段来使用。现举几个例子进行说明,具体如图7所示。
?
编辑切换为居中
添加图片注释,不超过 140 字(可选)
图7 多头字段的策略应用
根据多头字段加工的风控策略规则,很多情况下可以直接作为准入条件来使用,例如近3个月逾期次数、近6个月逾期金额等。无论所属策略是刚性规则(直接拒绝),还是柔性规则(保留标签),多头特征在风控策略模块中发挥着很好的效果,贷前环节可以有效识别申请用户的风险,贷中环节可以对存量用户风险进行监测分析。
除了策略规则的应用,多头字段在评分模型方面也有很好的价值。一方面可以作为基础字段,与其他维度字段(消费、设备等)形成模型拟合的变量池,另一方面可以将所有多头字段集中在一起,单独开发多头信息评分模型。但是,建立多头模型的过程中,为了体现模型后期上线的应用效果,在数据建模的特征工程阶段,务必要对特征变量的信息值(IV)、相关性(pearson)、共线性(VIF)等指标进行多维度分析,从而筛选出相对更有贡献效果的字段。
综上所述,多头字段在金融信贷业务的风控体系中,具有非常重要的应用价值,采用多个维度的评估分析思路,以及特征工程方法,可以较大程度地发挥多头字段的效果,从而为实际业务带来很好的效益。
….
~原创文章
如若转载,请注明出处:https://www.anshangmei.com/4114.html