从花呗风控开始了解风控系统
主讲:赵永新
▪ 目录
一、蚂蚁花呗简介
二、大数据风控体系
三、芝麻信用风控流程
四、FICO信用评价模型
五、大数据风控系统应用
一、蚂蚁花呗简介
消费金融是经济发展的驱动力。
与传统消费金融相比,拥有互联网属性的消费金融,能够更便捷的切入到各种消费场景当中。
1.发展历程
蚂蚁花呗是蚂蚁金服2015年4月推出的一款消费信贷产品,“先消费,后付款”。消费额度500-50 000元。主要用于在天猫、淘宝上购物,主要是80、90后消费者。后扩展至更多的线上线下消费领域。
2018年5月18日,蚂蚁花呗向银行等金融机构开放。
2017年6月14日,蚂蚁金服所积累的技术能力和产品,将全面向金融机构开放。
2017年,花呗独家冠名《超次元偶像》。
2015年双十一期间,蚂蚁花呗充分发挥了其无忧支付的产品能力,全天共计支付6048万笔。
2.应用场景
3.授信额度
蚂蚁花呗根据消费者的网购情况、支付习惯、信用风险等综合考虑,通过大数据运算,结合风控模型,也就是蚂蚁花呗风控模式得出的数据授予用户500-50 000不等的消费额度。
额度依据用户在平台上所积累的消费、还款等行为授予,用户在平台上的各种行为是动态和变化的,相应的额度也是动态的,当用户一段周期内的行为良好,且符合提额政策,其相应额度则可能提升。蚂蚁花呗无法通过他人代开通或提额,请不要轻信他人,泄露个人信息。
4.还款方式
为避免逾期,请确保支付宝账户金额充足。如果逾期不还每天将收取万分之五的逾期费。
5.社会价值
政策鼓励:
监管机构先后四次鼓励消费信贷创新,重点服务中低收入人群,释放消费潜力、促进消费升级。
普惠金融:
蚂蚁花呗所覆盖的线上消费者有不少是传统金融机构没有触及的人群。在蚂蚁花呗的用户中,有超过60%的用户此前没有使用过传统金融机构提供的金融服务。
促进消费:
用户在使用蚂蚁花呗后,消费能力较此前有10%左右的提升,对拉动消费起到积极作用。蚂蚁花呗对于中低消费人群的刺激作用更为明显,在蚂蚁花呗的拉动下,月均消费1 000元以下的人群,消费力提升了50%。
二、大数据风控体系
1.什么是大数据风控
大数据风控是指通过大数据核心算法建立风险模型,在收集各种维度数据基础上,结合评分和信用管理模型,提取出对企业有用的数据,再进行分析判断,最终达到风险控制和风险提示的目的。
大数据风控是平台在创新信用管理和风险管理方面的一种新思路。目前大数据风控使用的数据,主要是围绕客户信息,从财产、安全、守约、消费、社交等多个维度来评估客户的信誉水平,并为其建立客户信誉数据,从而减少风险的来源。
2.大数据风控的主要特征
高对抗性:当前市场黑产体量庞大,薅羊毛、黑中介、黄牛、冒名申请等时刻都在发生,防不胜防。
灵活性:黑产群体不断变化特征和行为,风控策略需及时更新,必须要保证风控策略的灵活性。
准确性:风控策略首先需保证准确性,在保证准确性的同时提高查得率及召回率(RecallRate,也叫查全率)。
3.大数据风控的重要价值
目前银行传统的风控模型对市场上70%的客户是有效的,但是对另外30%的客户,其风控模型有效性将大打折扣。而大数据时代的来临丰富传统风控的数据纬度,利用多维度数据来识别借款人风险,包括社交、征信、消费、兴趣等。客户数据越多,信用风险就被揭示的越充分,信用评分就会更加客观。
大数据风控中的数据维度可以作为另外的30%客户风控的有效补充。大数据风险控制的作用本来就是从原来被拒绝的客户中找到合格客户。识别出已经通过审核的高风险客户和欺诈客户,可以大大提高金融行业的效率和风控能力,有效的控制坏账率,从而让企业盈利。大数据风控是金融行业发展过程中必须结合的一项科技手段。
4.搭建大数据风控模型过程
5.大数据风控的应用场景
大数据风控模型的应用场景非常广泛,只要牵扯互联网金融的行业就少不了大数据风控的存在。
从资金的角度来看,风控模型是为了评估客户还款能力和还款意愿,反欺诈反作弊,防止客户薅羊毛和保证平台安全等功能。
从行业维度来看,主要包括消费金融、供应链金融、信用借贷、P2P、大数据征信、第三方支付(第四方聚合支付)等各细分领域,同时还可用于电商、游戏、社交等“传统”互联网公司。可以说,任何互联网公司都需要风控。
三、芝麻信用风控流程
芝麻信用作为蚂蚁金服旗下公司,拥有阿里巴巴的电商交易数据以及支付宝的互联网金融数据,包括余额宝、招财宝、- 煤电水气等生活缴费和信用卡还款等支付宝业务数据,同时,芝麻信用还拥有公安网提供的公共数据。芝麻评分有五个维度,分别是个人用户的信用历史、行为偏好、履约能力、身份特质和人脉关系。也就是说,芝麻信用的评分跟这五个维度有关。芝麻信用不会公布具体的评分细则,只公布大致的评分维度,让用户有提高信用评分的方向,却并不能通过具体的一两项行为来增加信用评分,以杜绝一些恶意作弊行为。
1.关于数据来源
未来,用户在网上的社交、购物、金融等各种行为,及其留下的各种蛛丝马迹,都可能会影响到个人信用积分的高度,从而对生活中的与信用相关的行为产生影响。
2.具体的数据分布
芝麻信用分数从350-950分,分数越高代表用户信用越好。一般情况下用户只要不违反征信,起步分数基本是550分左右。当分数到达一定程度,就可以获得日常生活中的一系列便利。
550-560大致在2%左右,陡峭上升;610-620大致在14%左右,然后平缓下降,740以上的就很小了。根据与外部信用卡账单数据和其他数据对比,分值越高,违约率越低。
3.评价维度
4.企业评价维度
5.贷款申请流程
四、FICO信用评价模型
1.FICO评分系统简介
美国的个人信用评分系统,Fair Isaac Company推出的FICO,Fair Isaac公司开发了三种不同的FICO评分系统,三种评分系统分别由美国的三大信用管理局使用,评分系统的名称也不同。Fair Isaac公司所开发的这三种评分系统使用的是相同的方法,并且都分别经过了严格的测试。即使客户的历史信用数据在三个信用管理局的数据库中完全一致,从不同的信用管理局的评分系统中得出的信用得分也有可能不一样。
2.FICO评分系统全球分布图
3.FICO信用应用
FICO评分系统得出的信用分数范围在300-850分之间。分数越高,说明客户的信用风险越小。但是分数本身并不能说明一个客户是好还是坏,贷款方通常会将分数作为参考,来进行贷款决策。每个贷款方都会有自己的贷款策略和标准,并且每种产品都会有自己的风险水平,从而决定了可以接受的信用分数水平。
如果借款人的信用评分达到680分以上,贷款方就可以认为借款人的信用卓著,可以毫不迟疑地同意发放贷款。
如果借款人的信用评分低于620分,贷款方或者要求借款人增加担保,或者干脆寻找各种理由拒绝贷款。
如果借款人的信用评分介于620-680分之间,贷款方就要作进一步的调查核实,采用其它的信用分析工具,作个案处理。
4.FICO信用评分的价值
FICO评分主要用于贷款方快速、客观的度量客户的信用风险,缩短授信过程。FICO评分在美国应用的十分广泛,人们能够根据得分,更快地获得信用贷款,甚至有些贷款,可以直接通过网络申请,几秒钟就可以获得批准,缩短了交易时间,提高了交易效率,降低了交易成本。信用评分系统的使用,能够帮助信贷方做出更公正的决策,而不是把个人偏见带进去,同时客户的性别、种族、宗教、国籍和婚姻状况等因素,都对信用评分没有任何影响,保证了评分的客观公正性。在评分系统中,每一项信用信息的权重不同,越早的信用信息,对分数的影响越小。
FICO评分系统得出的信用分数范围在300-850分之间,分数越高,说明客户的信用风险越小,但是分数本身并不能说明一个客户是好还是坏,贷款方通常会将分数作为参考,来进行贷款决策,每个贷款方都会有自己的贷款策略和标准。
从上表中可以看到两个规律:一是信用评分特别低和特别高的人占比都较少,大多数信用评分中等,大体呈现为左偏态的正态分布;二是信用评分分值越高,违约率越低。这个就是信用评分的核心价值所在,可以根据信用评分的高低进行诸如是否发放、贷款额度、是否需要抵押等重要决策。每种产品都会有自己的风险水平,从而决定了可以接受的信用分数水平。
5.FICO评分模式的主要因素
客户的信用偿还历史、信用账户数、使用信用的年限、正在使用的信用类型、新开立的信用账户。
(1) 信用偿还历史
影响FICO得分的最重要的因素是客户的信用偿还历史,大约占总影响因素的35%。支付历史主要显示客户的历史偿还情况,以帮助贷款方了解该客户是否存在历史的逾期还款记录,主要包括:
①各种信用账户的还款记录,包括信用卡(例如Visa Master Card American Express Discover)、零售账户(直接从商户获得的信用)、分期偿还贷款、金融公司账户、抵押贷款。
②公开记录及支票存款记录,该类记录主要包括破产记录、丧失抵押品赎回权记录、法律诉讼事件、留置权记录及判决。涉及金额大的事件比金额小的对FICO得分的影响要大,同样的金额下,越晚发生的事件要比早发生的事件对得分的影响大。一般来讲,破产信息会在信用报告上记录7-10年。
③逾期偿还的具体情况包括:逾期的天数、未偿还的金额、逾期还款的次数和逾期发生时距现在的时间长度等。例如,一个发生在上个月的逾期90天的记录对FICO得分的影响会大于一个发生在1年前的逾期90天的记录。据统计,大约有不足50%的人有逾期30天还款的记录,大约只有30%的人有逾期60天以上还款的记录。而77%的人从来没有过逾期90天以上不还款的记录,仅有低于20%的人有过违约行为而被银行强行关闭信用账户。
(2) 信用账户数
该因素仅次于还款历史记录对得分的影响,占总影响因素的30%。对于贷款方来讲,一个客户有信用账户需要偿还贷款,并不意味着这个客户的信用风险高。相反的,如果一个客户有限的还款能力被用尽,则说明这个客户存在很高的信用风险,有过度使用信用的可能,同时也就意味着他具有更高的逾期还款可能性。该类因素主要是分析对于一个客户,究竟多少个信用账户是足够多的,从而能够准确反应出客户的还款能力。
(3) 使用信用的年限
该项因素占总影响因素的15%。一般来讲,使用信用的历史越长,越能增加FICO信用得分。该项因素主要指信用账户的账龄,既考虑最早开立的账户的账龄,也包括新开立的信用账户的账龄,以及平均信用账户账龄。根据信用报告反映,美国最早开立的信用账户的平均账龄是14年,超25%的客户的信用历史长于20年,只有不足5%的客户的信用历史小于2年。
(4)新开立的信用账户
该项因素占总影响因素的10%。在现今的经济生活中,人们总是倾向于开立更多的信用账户,选择信用购物的消费方式,FICO评分系统也将这种倾向体现在信用得分中。在很短时间内开立多个信用账户的客户具有更高的信用风险,尤其是那些信用历史不长的人。该项因素有:
(5) 正在使用的信用类型
该项因素占总影响因素的10%。主要分析客户的信用卡账户、零售账户、分期付款账户、金融公司账户和抵押贷款账户的混合使用情况,具体包括:持有的信用账户类型和每种类型的信用账户数。
6.芝麻信用与FICO评分的差异
FICO评分系统得出的信用分数范围在300-850分之间,分数越高,说明客户的信用风险越小,它采集客户的人口统计学信息、历史贷款还款信息、历史金融交易信息、央行征信信息等,通过逻辑回归模型计算客户的还款能力,预测客户在未来一年违约的概率;最终会通过逻辑回归模型输出最终分数。
VS
芝麻信用分则是以大数据分析技术为基础,采集多元化数据,包括传统的金融类交易、还款数据,第三方的非金融行为数据,互联网、移动网络和社交网络数据等,帮助贷款方从多个方面考察个体的还款能力、还款意愿,做出合理、全面的信用评分。
五、大数据风控系统应用
1.贷前:望其面目,以绘其形
(1)准入。在贷前阶段,需要对客户的数据进行搜集、清洗、分析、应用,这是一个很长的链条,若运用传统风控费时、费力。但我们现在有大数据技术,可以精准挖掘申请人多维度信息,包括人口属性信息、社交信息、历史消费记录等信息,消费方式、兴趣爱好、社交偏好等相关维度信息。结合这些信息形成一张用户画像,对客户的贷款资质以及还款意愿、还款能力进行判断,辅助审核决策。不合格的客户在这个阶段直接被挡在外面,这样既防止后期“误杀”,也保证平台的客户质量,事半功倍。
一般涉及目标客群的年龄、职业范围和地区范围等内容,每家机构可以根据自己的业务特点进行选择。例如线上小额现金贷的人群为蓝领、小白领和私营业主等人群,借款人群的年龄集中在25-40之间。
(2) 授信。授信是根据一个平台的消费需求制定的,我们可以把消费需求作为一个基数,建立有效的信用模型和评分规则。利用灵活开放的数据导入技术、多维度的信用强弱关系评分项,以及专业的评级模型,对客户还款能力、还款意愿等更深入、更全面的“解剖、分析”,为平台授信决策做一个整体的评级。不同评级的客户:首先,风险系数的调整不同;其次,对于每一个评级的客户群体都要有额度的上限和下限。
2.贷中:由表及里,对症下药
(1)反欺诈。反欺诈,贯穿整个客户的生命周期,不仅在信贷环节,帐号登陆、注册环节就要进行防护。现行的欺诈手段主要是冒名欺诈、本人蓄意欺诈、以及不良中介诱骗他人间接实施信贷欺诈等。
反欺诈需要做好两件事,一是信息验证,二是行为分析。在行为分析这个过程中,依靠风控经验、客户信息验证、部分行为数据做预测分析,基于客户行为,通过打标签的方法识别不同的客户群体的风险程度。
反欺诈模块主要包含人脸+活体识别、风险名单检测、法院数据(失信人/执行人)、多头申请规则、设备数据反欺诈策略和其他征信数据等。该环节主要用于识别个人信息冒用、外部高危客户和中介代办申请等欺诈风险。
通过反欺诈模块的用户进入授信给额模块,该模块含模型打分和授信给额规则,综合考核模型分和反欺诈模块的结果给予用户审批结果,审批通过的用户获取授信额度。
(2)额度调整。在这个阶段客户大多有过至少一次的还款行为,那么平台就需要考虑如何调整客户的额度档次和息费,保证优质的客户得到更低的息费和更高的额度,而数据表现较差的客户需要用更高的息费来覆盖风险。额度管理环节包含额度有效期管理、额度冻结、降额和提额等;但不顾风险的一味追求高收益和不求收益的低风险都是没有意义的。额度调整的重点在于对客户需求和风险的合理预估。实则可以看成对资金在不同风险回报的分配,使得在一定的风险下,总体风险收益最大化。
3.贷后:闻其五音,以别其病
(1)账单催收。平台把资金放出去,要确保能收回,所以这时要追踪资金动态,一旦出现逾期则启动催收团队协助完成逾期处理、资产回收的工作。对于催收也讲究一定的策略,首先,针对不同风险的细分客户群体,制订差异化的催收措施;其次,把握催收的时机,因为催收的资源有限,我们需要按照一定的分配规则来分配催收资源。针对用户的逾期情况,机构可以采取资产回收模型和策略进行资产回收,涉及的环节包含电话回访、信函告知和外包回收等。
催收
(2)贷后监控。最后进入贷后监控环节。在信贷过程中,即使前中期的风控到位,也并不意味着信贷交易的万无一失,借款人环境变故、还款能力改变、还款意愿动摇等情况时有发生。而利用大数据技术,进行风险指标监控包含业务数据类(例如:成交量、通过率、审核时效等),风险策略运行监控类和风险表现数据类等。可以对借款人进行多维度动态事件及市场信息跟踪与监控,能够快速觉察、发现贷后借款人的数据异常情况,及时进行贷后预警,有效防范贷款人跑路,信贷机构坏账、死账等情况发生。
失联信息修复——芝麻信用可修复30%失联客户
对于商户端出现M4及以上的严重逾期且已经多轮催收失联的存量客户,芝麻可修复其中的38%客户。复联客户中的25%的客户会在1个月内选择还款,人均还款2万元,综合测算下来芝麻可修复客户人均还款2 600多元。
4.大数据风控对模型的挑战
模型的泛化能力:
某些金融机构上线的普通模型,上线时可能效果很好,但上线后命中量基本处于直线下降状态,但在黑产群体的轮番攻击下,一周后命中量可能接近为零。因此简单模型对金融机构的意义不大,黑产群体几天甚至几个小时就可以尝试出来并规避。
模型的可回溯性:
风控模型识别出来的数据需做相应的处理,任何机器识别处理都不可能完全避免失误,因此模型一定要了解业务特征,使得任何处理我们都有理有据。
模型的更新速度:
在高对抗性场景下,金融机构使用模型快速更新是关键。
5.提高大数据风控有效性的路径
对于金融研究部门而言,可从经济、金融等多个角度综合论证大数据风控的有效性,为大数据风控提供理论支持。如大数据风控如何顺应经济周期的变化,如何从统计上论证过去的数据对于未来行为判断的准确性,如何解决道德风险所带来的不确定性。