消费金融风控数据摸底:部分来源涉及灰色地带甚至涉嫌违规
消费金融风控数据摸底:部分来源涉及灰色地带甚至涉嫌违规
来源:21世纪经济报道
作者:王晓 黄小燕
八仙过海,各显神通。
机构涌入消费金融行业,面对多数缺乏征信记录的客户,判断他们的信用状况成为业务开展基础。
多位消费金融机构负责人表示,通过数据模型对用户的电商消费记录、学历、朋友圈、工作行业等数据信息分析,也可以判断用户的信用状况。但巧妇难为无米之炊,这些信用数据从何而来?
记者了解到,当前消费金融机构除自身体系积累的客户信贷数据之外,从公开途径已经可以获得许多信用相关数据。此外,从第三方数据公司购买数据或许更为有效。不过,由于当前国内征信体系建立仍有较长的路要走,部分机构获取数据途径“不太上台面”,涉及灰色地带甚至有违规嫌疑。
个人信用画像需要多种数据支持
查询央行征信数据曾被认为是代表个人信用的重要途径,但其用户覆盖面仍十分不足,信息有效性也面临局限。
“单纯靠一个行业的大量数据无法对一个主体完成信用评估。我们需要的数据维度更广泛多样,才能构成一个人的完整的信用画像。”考拉征信总裁李广雨表示。
李广雨介绍,考拉征信数据主要来源有两方面,就考拉征信自身股东方积累的数据源来说,拉卡拉有一亿个人支付数据以及数百万小微个体工商户的银行卡收单数据,此外,合作伙伴51job有招聘求职数据等,都可以作为征信建模数据来源的一部分。不过这些还不够,外部公开数据,包括政府部门的公开数据如工商信息、法院信息都已经接入,一些合作企业数据如电商公司、电信运营商数据在取得用户授权后也可以纳入信用评估中。
“京东商城的数据来源占比在逐步降低。”京东金融消费金融事业部总经理许凌介绍,京东金融自身数据也成为信用判断数据源之一,如用户在平台购买理财、参与众筹等都可以判断用户的资产状况。
“接入公安部认证、学历认证等外部数据大家都会用到,但大家都能获得的数据源只能说不是短板而已。”许凌表示,京东金融也一直在扩充数据源,投资了许多数据类企业如数库、聚合数据等。
芝麻信用人士介绍,当下芝麻信用的数据来源已有90%来自阿里体系之外,除电商数据、公共机构数据和合作伙伴数据之外,用户也可以自主上传反映信用状况的数据。在芝麻信用页面上,用户可以录入车辆信息、绑定职业信息以及查看公积金等。
“我们会要求客户授权采集在京东、淘宝等平台的消费数据以及通话记录等,这些可以判断客户的履约能力。”广东一位平台负责人介绍。
“还有很多行为数据可以反映用户的信用情况。有用户借款逾期,后来我们发现他有很多关于赌博的搜索记录。关于黄赌毒这样的搜索信息如果能提前了解就可以判定其为高风险用户。”一位消费金融机构负责人介绍。搜索信息也纳入了信用评价系统。
这些仅仅是消费金融机构风控数据来源的九牛一毛。包括行业共享黑名单、地理位置信息、水电煤气缴纳记录等都会被上述机构采纳,通过不同的选择和模型进行客户信用判断。
来源:购买数据、爬虫技术或涉灰色地带
不过,当前信用数据来源并没有统一规范,行业仍以自律为主。
芝麻信用人士对21世纪经济报道记者表示,其所有用户信息均在用户授权的情况下才能使用,并且只采用和经济信用评级相关的数据。根据征信业规范,芝麻信用不会采集用户通话、聊天信息,也不追踪用户的社交媒体言论。在使用中,第三方机构需要得到用户授权,否则谁也不能得到相关数据。
更多的机构或平台难以直接获得足够丰富的数据源,但通过一些特殊手段,这也并非难题。
“我们会接入很多家数据公司对用户数据进行交叉验证。他们的数据来源很丰富,有的是通过爬虫技术获得,有的是一些特殊途径购买的,比如搜索引擎、电商平台、电信部门、快递公司乃至银行系统的内部数据人员等。”北京一位平台人士介绍,“这些途径属于灰色地带,不过的确很有用。”
“大部分人在我们眼里都是透明的,没有一点隐私。”华南一位机构人士对21世纪经济报道记者坦承。他介绍,在接入二十多个数据来源后,无论用户如何变更住址或联系方式,基于身份证信息与大数据系统结合,都可以通过水电煤气缴费信息、实名手机号、电商消费记录等找到用户。这也是催收公司最常用的手段。
“很多数据都是不能外泄的,有些已经不是灰色地带了,可能已经涉及到违规甚至违法。”该人士介绍,“数据的获得和使用更多是行业默认的自律规则。比如我们就规定某一层级的业务员只能得到用户相应权限的信息。”
广东南方金融创新研究院秘书长徐北对记者表示,征信数据获取和使用主要仍靠自律。这是当前征信体系不完善所造成的,一些公共部门不愿意数据共享。相比较部分国外公共部门共同建立征信体系,失信者在社会中寸步难行,能产生震慑作用。
“当前很多企业以大数据名义开展征信业务,但又不在监管范围之内,很容易侵害用户信息安全。除当前8家个人征信试点机构之外,其他大数据征信机构等都应当加强管理,纳入央行监管和审计的范畴内。”有市场分析人士表示。