“用户线上输入信息后,10秒内就能得到授信结果,”智能信贷服务商读秒CEO周静介绍道。
互联网信贷平台大多宣传“5分钟”或“当天”审批。而传统银行信贷审批程序更复杂,需要经过触客申请、预审、材料递交、录入、运营、终审等,整个流程动辄2周。
技术是fintech的绝密黑箱,为什么fintech能够比银行效率快这么多?
其实整个流程很简明清晰。以用户A为例,A通过前端页面提交身份信息、信用卡、手机号等简单数据,便开始进入了10秒的过程。
首先, A从前端提供的信息将进入读秒数据湖中。
读秒数据湖有来自40多个数据源的数据,加上A提供的数据,将组成一个与A相关的数据集合。这个阶段,“数据集合A”将通过一些简单“规则”对数据进行初步清洗和筛选。
为了提升清洗效率,这些“规则”不是复杂模型,通常会设置的非常简单,比如年龄必须大于20岁,芝麻分高于600分等要求,在这些规则下,读秒迅速剔除了无还款能力的学生以及信用过低的人群。只有通过基本规则的申请人,才会进入下一步数据处理模型。
“大数据风控的壁垒不在于数据的数量,”周静说,读秒的40多个数据源中很多都是大家都在使用的数据,比如芝麻信用、运营商数据等,对数据的精细管理和挖掘才是大数据风控的难点和壁垒。
数据处理模型是第三个环节,也是大数据风控技术中所谓的黑箱环节。其中包含多种模型,比如反欺诈模型、盈利模型、用户行为模型等。读秒提取100个主要变量,进行交叉验证,形成500多个主要维度去建模分析,读秒通过数据挖掘、特征提取、机器学习等技术对这些数据进行数据筛选、提取、处理,形成相应的评分。
举例来说,用户填写的“收入水平”为变量A,“工作地点”为变量B,申请时IP地址的“所处区域”为变量C。
从A+B的维度来看,倘若用户填写的A月收入有数万元,B却显示在某个偏远山区的修车厂工作,我们或许应该怀疑用户隐瞒收入。
若从B+C的维度来看,倘若B变量显示用户工作地点在北京,C却显示申请时IP地址在云南,或者频繁更换IP地址去申请,我们或许应该考虑金融欺诈的风险。
若结合A+B+C的维度来看,若B变量显示客户在北京国贸工作,A变量显示月入10000元,IP地址、申请地点都在北京,通过三个变量数据的交叉验证,可以初步推断申请人是常住北京的中等收入白领。
数据的使用决定了风控水平的高低,大数据风控的意义也在此体现。倘若再在以上,增加更多变量,用更多维度去看数据的重叠和交叉,更加能验证出数据的可靠性。
最后,基于用户信用行为,各项模型会综合做出评分,根据评分高低,每个客户得到不同的授信结果(可贷金额、期限、利率)。
“速度、体验、风控需要得到平衡。”周静说,在很多情况下,一味强调强风控会导致需求数据过多,授信速度不够快,用户需要提交更多资料,用户体验也难以提高,“这些相互掣肘的因素必须不断磨合优化,达到最佳的收益与风险比。”
据零壹财经发布的《消费金融技术驱动洞察报告》统计,自读秒2015年6月成立起,业务量迅速增长,从成立初期每日处理几十笔申请,至今每日处理3万多笔申请,授信时间仍保持在10秒以内,这在行业内实属罕见。据统计,截止2016年8月,读秒已经覆盖全国269个城市,申请用户超过340万人次,目前每月申请用户约70万人次。
读秒介绍:读秒成立于2015年,是PINTEC智能金融服务集团旗下的“智能信贷服务商”。可在10秒内,实现纯线上、无抵押、无担保的借贷服务。读秒的三种业务模式分别是:个人版读秒、企业版读秒、POWERED BY DUMIAO(读秒驱动)。目前已与十多家企业达成合作,涵盖金融、医疗、电商、旅游、生活服务等领域,合作伙伴包括安盛、康德乐、乐视、去哪儿、携程、58同城等。