数据共享困局:数据造假、私下买卖,上百平台市场混战业界
12月,金融强监管到来,行业逾期全面爆发。
这背后的深层次原因,无疑是“多头借贷”太过严重。
“经历过这次下行周期,市场被教育了一次,意识到了共享的重要性。”多位业内人士称。
中国共享意识,全面觉醒。
目前,市面上已出现上百家数据共享平台,未来,这个数字将呈几何级增长。
一个真正的共享时代,已徐徐而来。
01 共享觉醒
12月是金融行业风雨飘摇的一个月。
行业强监管袭来,此前对自己风控能力充满信心的公司,发现自己的逾期率和入催率在嗖嗖上涨。
“此前我们去和公司谈,参与数据共享,大多人并不理会。”某个人征信试点的商务负责人程烨发现,最近这些公司对于“共享”积极了很多,甚至很多公司主动来敲门。
共享平台们,已感知到共享意识的觉醒。
目前,市面上有上百家数据共享平台,这其中分为几大类别。
最早入场的是官方系。
早在2009年,央行征信就正式控股上海资信有限公司。
“业内都认为,上海资信是央行征信的补充,专门用来收集央行征信之外的借贷数据。”监管人士林海峰称。
此外,还有一些有官方背景的协会,也成立过数据共享平台。
比如中国支付清算协会下的,小微金融风险信息共享平台。
第二派,是企业系,是各大公司自建的平台。
比如中诚信、中智诚、京东金融、宜信旗下致诚信用的阿福平台、算话征信、同盾、91征信等平台。
除此之外,还有一些有数据的支付公司、短信平台都纷纷做起了数据共享平台。
“知名平台有30多家,大大小小的平台都算上得有100多家。”林海峰预估,这一切才是刚刚开始,未来将出现更多细分垂直的数据共享平台。
而这一轮新的爆发,偶尔中也带有必然。
中国的征信体系,在曲折中盘桓多年。
2015年,国家正式开放了民间个人征信市场,号令枪一响,第一批试点的8家机构,开始撒丫狂奔。
大家望穿秋水,等待着牌照,最终等来了却是监管的“全盘否定”。
“8家进行个人征信开业准备的机构,目前没有一家合格。”中国人民银行征信管理局局长万存知在会议上称。
两年探索,一夜归零。
无疑,征信建设是一个漫长而风雪交加的征途,急不得。
但互联网金融等不了。
对于金融行业来说,征信太过重要,可节约大量风控成本。
行业开始自救,市面陆续出现一批数据共享平台。
在最早期,数据共享平台都喜欢收集“黑名单”,就是逾期数据。
随着消费金融的普及,很多用户开始多头借贷,借新还旧,以贷养贷。
黑名单数据开始“失效”。
“2015年,网贷很火,平台几千家,导致行业的共债已非常严重。”致诚信用总经理赵卉称,过度负债的结局,有太多前车之鉴,比如韩国的信用卡危机、台湾的卡债风暴等。
“债务会累积,像雪球一样越滚越大,等支撑不住崩盘的时候,债务危机才会集中爆发,一个好用户,也会突然间崩盘而不还钱。”林海峰称。
说到底,借贷需要评判两个要素:还款能力和还款意愿。如果共债严重,就很难正确判断一个人的还款能力。
不久,整个行业调转船头,从只收集“逾期数据”的黑名单,转到了收集借贷的“全周期数据”,以此缓解“多头借贷”严重的现状。
“征信的精髓,就是共享。”林海峰称,因此,行业共享平台的建立,是必然,也是趋势。
02 困难重重
2016年下半年开始,数据共享平台大量出现,一时间行业百舸争流。
但总体来说,发展不尽人意。
先来说说官方派。
因为是官方机构或半官方机构,吓得部分存在问题的公司不敢来共享。
“谁能说自己是一张白纸,没有一点问题?”林海峰笑称。
另一方面,因为官方派缺乏互联网基因,服务和运营意识并不太好,“前期共享完了,后期的服务体验不好”。
而企业派,则是问题重重。
林海峰注意到,大家做共享平台的出发目的,不太相同。
“有一些是为了利益而来。”林海峰发现,一些平台的规则是,共享了数据的,查询不收费,但是其他公司要想来查,就得收费,“几毛到几块不等”。
还有一部分,是为了数据而来。
林海峰就曾经调查到,一家数据平台收集到数据后,再偷偷拿到各地的大数据交易中心去买卖。
或者直接成立一家“关联公司”,在市面卖数据。
还有一些玩家,当了裁判员,还同时当运动员。
“一家头部的数据共享平台,公司负责人的直系亲属,又成立了一家贷款公司,拿着各家的金融数据再去放款。”程烨称,这在圈内,早就成为了公开秘密。
因此,在最早期,金融公司并不太愿意共享数据。
第一,他们也无法判断平台动机是否纯良;第二,数据是他们的“核心机密”,他们也不愿意拿出来。
“谈一个共享用户太难,反反复复去磕。”程烨一度认为,共享在中国不太可能做起来,大家“自扫门前雪”的心态太严重,相互敌视,不信任。
在如此利益交集的江湖,“相互不信任”,成为数据共享最大阻力。
为了消除金融公司的顾虑,各家公司都打出了新的底牌。
第一种方式,就是不需要金融公司上交数据,只要提供一个接口,每次有人查询时,直接反馈一个脱敏结果。
但这依旧没有消除金融公司的顾虑,“这个接口是否安全?共享平台是否能以此为抓手,伸进底层数据库?谁都不敢保证。”程烨称。
市面上有人提出了,用技术来解决。
林海峰最近参加了很多大数据峰会,发现很多数据共享平台都在宣称用“区块链”的技术。
他要求去看底层架构的时候,对方却变得支支吾吾。
“很多都是噱头,区块链在共享平台运营还比较早期,真正走出模式来的,没几家。”林海峰对此也不乐观。
“我们也加入了很多数据共享平台,但是调取平台数据的时候,发现效果很差。”某公司的数据模型负责人坦言。
此后,他们再也没有加入过任何数据共享平台。
数据的表现,为何不尽人意?
“数据掺沙子的问题,一直存在。”致诚信用总经理赵卉称,很多金融公司的想法是,把一些好用户,杂糅到黑名单里,“他们以为,如此别人就无法抢走自己的用户”。
“这就导致,很多平台的数据被污染,真假难辨,失效失真。”程烨称。
建造平台目的不纯、相互不信任、数据造假等多种问题,整个数据共享行业都尚在迷雾中摸索。
03 前路漫漫
行业诸多问题叠加,实际上,无非就是要解决一个“公信力”问题。
要建立公信力,出发的目的,就不能太功利。
多位共享平台的负责人认为,数据共享,应该用“纯公益”的操作思路。
“带有私心和目的,行业内的人都不会认。”小微金融风险信息共享平台的负责人透露。
赵卉持有同样的观点,所以致诚阿福的数据共享,并不收费。
“宜信的创始人、CEO唐宁在内部会议上,说要进行数据共享,大家都颇为反对,觉得这个事情吃力不讨好,很难做起来。”赵卉称,但唐宁很坚持,说这是对整个行业都有益处的事情,能够帮助整个行业降低风险。
唐宁提出方案后的2016一年,都是“让行业机构免费来查宜信的数据”。直到2016年年底,致诚阿福的共享平台才成立。
也就是说,他们花了一年多来教育市场,培育信任。
“我一直相信六度空间理论,也就是说,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”赵卉称,这个圈子很小,纸是包不住火的。
“因此,永远不要作恶。”
她在圈内听说一些大公司会数据“掺沙”,至今她都拒绝合作。
同时,加强数据的交叉验证和审核,这一步也不可少。
“我们对数据进行反查抽样,机器和人工交叉验证,一旦发现异常,就会深入查验。”赵卉认为,要爱惜羽毛,才能飞得更高更远。
“现在已有数据查验模型,容易发现数据中掺的沙子。”赵卉称,她已清退了3家数据存在问题的公司。
除了技术之外,还可通过制度来防止“数据造假”。
一家加入信联的征信机构数据共享平台称,他们将在明年开放C端用户的数据查询。
这个逻辑和查询央行征信很像。
用户本人,可以去央行申请查询个人征信,如果发现逾期等负面记录有误,可以提出异议。
这个方式可以让用户自行发现数据真伪。
共享要用“公益”思维,但这件事情并非毫无想象力。
一家金融公司不是光有数据,就可做好风控,还需要技术和经验。
比如致诚阿福,就在共享平台后已布局了“群星”和“天迹”两套系统,给金融公司提供全业务流程的风控解决方案。
前端,共享平台聚合行业,后端,又将宜信多年的经验输出。
这样的商业模式,才足够智慧。
美国征信的建立,花了近百年的时间。
中国征信出发才几年,前路漫漫。
“数据共享必须沉下心来,重运营重服务重质量,才可能成。”林海峰称,因为数据是敏感资产,尚有不慎,就可能“走偏”。
这里同样只欢迎深耕者,拒绝投机取巧的“揩油者”。
(应受访者要求,本文部分人名为化名 | 图片来源网络)
来源:钛媒体 作者:一本财经
1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。