媒体中心
Media centre

“Test And Learn”,大数据核心方法论

发布日期:2016-05-13 15:40:18  网络  

返回

[字号   ]

  大数据在互联网金融领域已经成为热词,但是如何利用对于开采者来说,却是“八仙过海、各显神通”。有人表示,“Test And Learn”,才是大数据应用于P2P风险管理的核心方法。

  所谓“Test And Learn”,意思为“测试与获知”,意味着在放款实践中收集数据,通过建立风险模型和目标变量,研究客户数据与信用行为之间的关系,从而调整授信策略。
 

  目前借款人大概几十万。在客户数据分析当中对每个借款个体采集的数据项超过1500个,并须在“细枝末节”中寻找线索。比如,关注申请人的邮政编码最近12个月是否变更,关联的信用卡张数是否变化,最近3个月、6个月的信用卡消费总额、交易类别与交易次数是否出现异常等。这些变量构成了我们CDS(自动化授信决策系统)的重要依据。


\
 

  总体来说,我们在自动化授信决策中主要依据几个纬度,根据不同的借款类型、不同的地区,借款金额、借款用途等等,这个纬度结构具体组成了一个网状型的决策机制。
 

  第一个纬度是预测你还款的可能性。
 

  第二个纬度是,你这个申请从根本上来说有多大可能是假的。也许你的数据很好,看上去很漂亮,但是借款人的名字填的不是你。也就是说你有多大可能性在你的申请过程中采用了假的数据。说轻一点叫数据不真实,更严格来说叫“欺诈”。
 

  第三个纬度是,假定借款人借给你钱了以后,你所产生的风险调整后的收益是多少,你可以为整个交易贡献多少,你可以为借给你钱的人提供多少收入。
 

  但是数据的纷繁复杂会让开采者遭遇困境。在我们设置的上千个数据纬度中,实际有用的数据可能只有100个。不同数据纬度间的逻辑关系,也很有可能产生冲突。不断地测试并且获取正确的数据维度和信息,构成了信而富的大数据应用的核心机密。
 

  举个例子,在常识看来,手机用户的开户时间越长,手机号码从不改变且经常使用,是稳定性的标志。
 

  但这其中仍有许多不确定的因素。手机号用多少年算长?是两年还是三年,或是十年?那么我们须针对使用一年、两年、三年、五年号码乃至更多的手机用户分别作一些测试,通过这些用户的借款行为不断进行总结。假设公司发现使用手机号少于三年零两个月的用户借款风险较高,过了这个点后风险率显著下降,那么“三年零两个月”这个数字就是我们的授信标准,也是公司的核心机密。
 

  欢迎关注东汇征信有限公司公众号:DHZX-CMS,交流心得。声明:东汇征信有限公司分享的相关新闻、干货、文章未能与原作者或来源媒体联系,若涉及版权问题,请原作者或来源媒体联系我们及时删除。
 


 

热帖推荐:
 

  P2P风控如何玩转大数据?
 

  消费信贷中的大数据风控原理
 

  业内:牌照收紧,首批支付牌照续牌遭监管风暴

返回