个人金融借贷场景下,大数据风控的行业分析及应用分析

创业点子 阅读(1605)
88明升

大数据风险控制现在是金融科技公司竞争激烈的商业场景。什么是大数据风险控制?这个行业的前景如何?哪些机构在布局中竞争?什么是产品形式?本文将重点介绍个人贷款方案。

RT3RuCIAfR6rFV

根据流行的概念分析大数据风险控制:通过使用大数据建立模型,向借款人提供风险控制和风险预警。

这句话涵盖了大数据风险控制所需的四个要素:

1.原材料:大数据

2.实施:技术模型

3.目标群体:场景中的群体。

由于本文主要涉及个人贷款情景,目标群体是借款人。还有其他场景,例如信用卡申请人的信用卡场景,分期付款用户的购物场景,租赁安装者的租赁场景,投保人的保险场景,投资者的投资融资等。

RVhB0SlHvVCYQc

4.目的:风险控制和风险警告。一般组织有两个主要目的:

目标1:为了减少损失,有必要识别好用户和坏用户。 2:为了最大化利润,有必要对用户资格进行分层。

基本特征是能够实时大量实施风险控制和风险警报。

大数据风险控制的名称实际上是将其与传统的风控制区分开来。

传统的风力控制在2016年之前相对普遍。它的特点是离线风力控制场景。用户需要填写大量的个人信息,并提供工作证明,水证明,地址证明等。审核时间一般为1-3天。银行系统将持续约3-7天。

在正常情况下,用户档案需要填写以下信息:姓名,性别,年龄,身份证号码,家庭住址,受教育程度,家庭人数,婚姻状况,单位姓名,单位电话号码,职称,单位性质,收入来源有关收入水平,配偶详细信息,业务详细信息和其他资格的信息。

除此信息外,您还需提供纸质身份证复印件,工作证明收入(盖章),半年银行用水,公用事业或房屋租赁合同。

此外,银行等被许可人还将检查用户在中央银行的信用报告,以协助风险控制。

RVhB0T89M0eJpk

这些数据的潜在含义可以解释如下:除了年龄代表进入门槛,一般贷款产品要求借款人年满22岁或以上,现金贷款产品将提出年龄阈值到18-20岁及以上。有些产品需要高中以上学历,或者需要非学校学生。在其他分组之后,它们代表借款用户的还款能力,债务状况和信用状况(没有还款意愿)。

直接体现或间接反映还款能力:

家庭数量。家里有很多人,你负担不起。有些人可以在收集后帮助你; 2.婚姻状况,大多数家庭,婚姻优于未婚家庭收入或经济稳定; 3.单位名称,单位电话,工作岗位,单位性质,收入来源和收入水平直接反映收入水平和收入稳定性; 4.有关业务细节,其他资格等的信息。

反映债务状况和信贷状况:央行信用报告

在获得此类信息和材料后,风控制器将根据经验并根据标准化程序审查材料的真实性。例如,通过拨打公司的电话号码来检查工作收入的证明,以检查是否有任何人和位置,其他资格材料,以查看密封判断真实性,水将检查银行电话的真实性。

传统风险控制的模式和节奏不符合互联网金融的快速发展。在互联网金融时代,第二个订单中的数十万用户群同时发起贷款。如果进行人工审核,则完成从进入到批准的整个过程。可能需要1个月才能完成。

传统风控升级为大数据风险控制是行业发展的需要。它还受益于各种类型的用户数据的标准化,即API的形式,并且金融机构可以直接访问各种必要的数据接口。用于获取用户的数据。

整个过程填写来自用户的所有信息,并且通过提供姓名,ID卡,银行卡号和移动电话号码这四个要素,可以获得所有或大部分风控制所需的用户信息。

大数据风险控制的快速性受益于各种标准化数据接口,但由于代表用户的各种数据分别存在于不同的组织中,因此这些数据原则上要求用户授权为外部,并且数据输出需要符合要求。脱敏治疗。

因此,大数据风险控制需要获取传统风险控制要求用户填写的所有信息,或者直接或间接证明用户的还款能力,还款意愿,债务状况和信用状况,每种类型都需要访问。缺少类型的数据源也需要找到替代数据接口。

以下各节介绍了大数据风险控制所需的数据类型。

除贷款方案外,还有哪些其他方案需要使用大数据风险控制?

在这里,猎人会举几个例子:

最常见的金融业是投资和融资部门。投资该部门需要预防和控制非法集资,洗钱和资金盗窃等风险。

在贷款部门,贷款前需要进行反欺诈和用户风险识别,信用风险评估,贷款风险评估和贷后风险警示。

RVhB0TQ2SIAwVi

电子商务行业需要在用户注册过程中进行防螨毛,需要确定注册充值用户需要防止资金被盗,账户被盗,交易经常被拒绝的情况。

在保险业,尤其是人寿保险产品中,有必要对被保险人的身份进行核实,以防止被保险人投保。

事实上,除了这些常见的行业场景之外,只要各行各业都涉及个人信息和资本交易,就会使用大数据风险控制。唯一的区别是不同场景的数据和策略是不同的。

传统的风险控制基本上由金融机构内的风险部门和商店经理组成。第三方组织更多地提供大数据风险控制。

大数据风险控制行业主要涉及以下7种类型的机构:

监管部门或牵头机构:百兴信用信息,互助金协会和小额贷款协会;非银行贷款机构的金融技术公司:持牌小额贷款公司,P2P机构等,如福福和益新;电子商务其金融科技公司:京东金融,蚂蚁金融等;互联网巨头的金融科技公司:小曼财经,腾讯云等;银行金融科技公司:银联智能,建行金科等;企业服务:系统服务提供商,技术提供商,数据经纪人等,如同都和百荣;支付机构金融机构:天一信用:信阳正信。RVhB0TiDyqOhm4

这些机构拥有情景,资本和贷款业务的全部或一个要素,这些因素决定了它们对大数据风险控制的竞争障碍。

该场景代表了稳定的数据流和准确的客户图像,可以免费或低成本地用于风险控制;

资金代表了切入任何贷款场所,获取数据和影响产品形式的自由;

贷款业务表明在特定情况下存在某些用户贷款业绩数据和基本风险控制能力。一些组织成熟的风控能力也可以直接输出和实现数据,并切入系统外的场景以获取更多数据。

因此,数据量级,数据成本,风险控制经验和财务风险容忍度的组合决定了组织在大数据风险控制方面是否具有足够的竞争力。

个人贷款金融业大数据风险控制行业的前景可以从两个方面看出:

一个是没有抵押贷款的国内消费金融市场的规模和渗透率。只要消费者金融市场中的股票客户需要再融资,并且增量客户群有转换空间,这意味着贷款业务仍在继续,这里对风险控制的需求是持续的。

中国个人消费金融的市场规模增长了近三倍,从2013年的12亿增加到2018年的近38亿;到2018年,无住房贷款规模已达到8亿,渗透率为22.36%。如果到2020年渗透率可以增加2.5%,那么市场规模将增加3.5万亿。这个空间足以让很多公司在这里竞争。

RVhB0llGn4pzi3

大数据风险控制组织的收入来源之一是数据接口的呼叫数量。呼叫数量与借用用户数量密切相关。

包含在中央银行中的大多数信用记录用户属于相对高质量的用户组,例如银行。这些群体很可能陷入非银行互联网金融,不在中央银行系统的信贷用户是互联网消费金融机构的潜在客户。

通过中央银行的查询量,可以知道银行系统的信用需求中的用户数量。超过80%的用户无法从银行系统获得贷款,因此理论上他们可以成为消费金融机构的潜在客户。

2015年,在2018年,有6.3亿个查询达到了17.6亿个查询,表明有许多用户需要信用。但是,记录的信用数量增加了1亿,表明大多数用户无法获得贷款,或者如果您需要贷款,您将同时申请多个机构的贷款,您将获得近10个查询每人。

众所周知,大数据风险控制机构在消费者融资方案中非常有前景。我们了解其在消费金融产业链中的作用和功能。消费金融产业链的作用包括:

监管机构:银行保险监管委员会,中国人民银行等;消费者金融服务提供商:商业银行,电子商务平台,许可公司,分期付款平台,非许可机构;基金提供者:自有资金,信托,ABS,银行贷款第三方支付机构:负责提供支付渠道,给予汇款机构贷款或代扣代缴;收款或不良资产机构:贷款逾期,客户流失后;消费者:不同的情景消费的资本需求是不同的;风险控制和信用报告机构:负责提供大数据风险控制服务,包括数据,技术服务,模型策略等.RVhB0mZIKKyygy

除消费者外,产业链中的每个角色都有可能附加风险控制和信用报告机构的作用,并出口大数据风控能力。

猎人将消费者金融大数据风险控制场景划分为5个环节和6个应用场景:5个环节包括反欺诈,身份验证,贷前审查,贷款监控和贷后收集; 6个应用场景对应不同的链接。

反欺诈:

申请贷款的用户群体的反欺诈识别,识别能力主要取决于风险列表,高风险列表(逃离,黄色赌博,涉及案件),法院违约者名单等。到虚拟手机号码,风险IP,风险列表区域等,通过列表进行反欺诈识别。

RVhB0n47ilqhly

此外,您可以在用户使用的设备端执行反欺诈识别,以查看它是否是风险设备。您还可以通过群组协会了解该群体是否具有欺诈性。例如,应用程序集中在一个IP地址,一个户口登记地点,并且地址簿具有相同的个人联系信息。

身份验证流程:

进行贷款和行业身份验证。在反欺诈识别过程中,无风险用户进入身份验证过程。这里,ID卡2元件接口可用于验证用户的姓名和ID号是否为真;用户是否通过活体识别进行操作;界面,验证用户姓名身份证手机号码是否一致,手机号码是他的真实姓名使用;通过银行卡验证,核实用户提供的银行卡,防止贷款成功,贷款资金到其他人的账户是欺诈性的。

贷前审查:

获得授权信息,并且通过身份验证的用户在有或没有感知的情况下执行必要的信息获取,并为随后的模型分数准备数据。非感知获取包括长期贷款数据,消费者金融图像数据,手机号码状态和持续时间数据等;通过感知获得的数据(要求用户提供相关账户密码):运营商报告,社会保障基金,职业信息,学术信息,中央银行正在收集信件等。

根据获取的用户相关数据,根据不同的算法模型,用户应用程序链接的记分卡,贷款流程的行为记分卡,信用额度模型和资格分层模型,借用用户的分层和信用输出。不同的机构有不同的方法来评分不同的模型,目的是专注于风险识别和用户资格评估。

贷款监控:

上一环节获得的大部分数据也可用于贷后监测,监测正常指标是否发生了严重变化。例如,如果没有长期借款情况,在申请成功贷款后,发现用户在其他地方有多笔贷款。此时,用户可以被列为防止逾期的关键问题。

贷后收款:

在这个时候,收集的主要需求是为失去的客户。填写贷款的客户数量不再可用。有必要通过大数据风险控制公司以某种方式获得客户的实际号码或其他不是真实姓名的号码。赶上这个人的概率。

大数据风控制与数据密不可分。这些数据猎手将是主要的7种主要类型。存在这7种类型有两个主要原因:

首先,这些数据维度可以直接或间接反映用户的还款能力,债务状况,信用状况和其他潜在风险。除少数情景外,大多数数据维度已在金融信用风险控制流程中得到验证。类型数据不合适。

其次,数据已经标准化,系统中合作伙伴贷款机构的最低交叉比率超过40%,即在贷款机构的100个用户中,其中40个可以在数据中找到接口。人和以上数据。

RVhB0nNCvPKuRZ

还有一些原因可以解释为什么这些数据源的频率足以满足风险控制公司的要求,特别是高风险列表。这些要求是实时的,并且ID卡元素不需要实时更新。

主要数据类型是:

身份信息:身份证,银行卡,手机卡,教育,职业,社会保障,公积金;贷款信息:登记信息,申请信息,共同债务信息,逾期信息;消费信息:POS消费,保险消费,淘宝消费,京东消费兴趣信息:APP偏好,浏览偏好,消费类型偏好;旅游信息:经常出城区,旅游,铁路旅行;公共检查法肖像:不值得信赖的执行,诉讼,飞行,黄色赌博;其他风险肖像:航空铁路黑名单,支付欺诈,恶意欺诈。

大数据风险控制需要如此多的数据类型,源在哪里,哪些组织是数据?

身份证数据来源:公安,公安,身份证信息查询中心;银行卡数据来源:各银行,当地银联;手机号码数据来源:移动,中国联通,电信;学术数据来源:Xuexin.com;社会保障公积金数据来源:社会保障局,公积金管理中心;借款数据来源:中央银行信用信息中心,信贷业务银行,消费金融机构,小额贷款公司,P2P和金融机构提供贷款服务(工厂机构);旅游数据来源:中国航空,铁道总局,旅游APP,运营商,APPs定位;消费数据:银行,电子商务平台,第三方支付,情景平台;兴趣数据来源:运营商,各种PC平台网站,各种应用,搜索引擎,手机系统提供商。RVhB0ndD5Hg9lP

实际上,上述来源只是数据导出业务的一小部分直接,因为大多数源公司不负责数据合规输出和现场管理,而数据业务利润不是其主要业务。

因此,在大数据风险控制行业中,提供数据服务的是通过相关关系获得代理权的一些数据代理,以及为这些源公司提供系统服务的系统供应商。

大数据风控的实施是传统风控专家经验模型与当今依赖算法模型的结合。原因是算法模型能够在大多数常规情况下准确识别风险情况,但少数特殊情况需要人工干预和纠正。

专家经验模型的过程是将遇到的新问题(新申请人的数据)作为输入参数,风险控制专家可以根据历史情况(不同客户群的好坏表现)总结,找出相关法律(A客户群对应好,B客户群对应坏,C客户群没有遇到,但可能是好等等,以便判断出新问题的路径情况可能会发展(新客户贷款的好坏)。

RVhB11p9e01HEg

算法模型主要依赖于统计公式。该过程是将新数据(新应用程序用户的数据)作为输入参数。在馈送大量历史客户样本之后,可以区分算法模型(随机森林,决策树,逻辑回归等)。在不同的客户组中,判断新用户是否对应于模型结果中的好或坏客户分类。这将引入第三方数据源(KS,IV,AUC等是确定第三方数据有效性的指标),并查看哪些数据可以提高算法模型的识别准确性。

实际上,从过程可以看出,算法模型用算法模型代替了人工经验链接,从而实现了判断好坏客户的规则并将其标准化。但是,当某些情况不在历史数据中时,算法模型可能无效,并且需要手动参与调整。为了解决新问题,算法模型表现不佳。现在,组织已经尝试用新的算法或逻辑来模仿劳动力。调整这项工作。

大数据风险控制行业有四种最常见的产品形式:

API接口:主要输出裸场,脱敏场或得分值; SDK:爬行动物产品,设备指纹等;例如,学术爬虫界面,输入用户帐号密码即可登录信令网络爬上用户的学历资料。 H5报告:用户风险报告,用户评级报告等;机器模型和决策引擎。

风控模型团队通常需要API接口和SDK。需要包含详细字段以提供模型。一些没有模型团队但由技术部门支持的组织通常更喜欢直接使用API分数或H5报告。虽然机器模型和决策引擎主要是丰富但不熟悉风险控制行业或现有技术团队不熟悉大数据风险控制,它将直接购买模型和决策引擎直接启动信贷业务。

RVhB128FHh3TUy

以上产品形式主要针对B端客户,一些大数据风险控制机构正在开发C端业务内置报告的产品形式。

大数据风险控制是一个非常复杂的系统。其在个人贷款风险控制领域的应用相对成熟。这场比赛现在处于热门阶段。众所周知,这个细分市场的风险控制产品的创新已经到了瓶颈。组织的规模只能围绕数据覆盖和风控识别的两个维度进行优化。

同时,由于具有消费者金融需求的个人基本上已经获得了超过其还款能力的信贷服务,因此获得新客户的成本显着高于前两年。这是大多数金融机构合规产品的盈利能力。不可持续,维度稳定甚至紧张的局面导致提供个人风险控制的大数据风险控制机构的收入水平下降。

另一种情况是大型数据风险控制机构重新强调小型和微型企业的风险控制服务,并逐步加大研发力度。希望在小微企业白热化控制之前,市场规模将被占领,形成强大的障碍。生活。

Big Data Hunter,微信公众号:date-hunter,每个人都是产品经理专栏作家。多年的金融业(基金,财富管理,保险,信贷等行业)相关的战略研究,行业分析,商业模式建设经验,熟悉金融+大数据+风险控制+营销。

本文最初发布于每个人的产品经理。未经许可,禁止复制。

该地图来自Unsplash,基于CC0协议