一本财经
金融科技(FinTech)第一深度新媒体。专注金融科技领域调查、深度、原创、独家报道,以及商业案例解析。我们不生产碎片化新闻,只出品深度而专业的报道。
32篇文章
85142次阅读

数据共享困局:数据造假、私下买卖,上百平台市场混战

2017-12-27 07:40··互联网  零和 米格  一本财经  收藏
   
“我一直相信六度空间理论,也就是说,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”赵卉称,这个圈子很小,纸是包不住火的。

  12月,金融强监管到来,行业逾期全面爆发。

  这背后的深层次原因,无疑是“多头借贷”太过严重。

  “经历过这次下行周期,市场被教育了一次,意识到了共享的重要性。”多位业内人士称。

  中国共享意识,全面觉醒。

  目前,市面上已出现上百家数据共享平台,未来,这个数字将呈几何级增长。

  一个真正的共享时代,已徐徐而来。

  01 共享觉醒

  12月是金融行业风雨飘摇的一个月。

  行业强监管袭来,此前对自己风控能力充满信心的公司,发现自己的逾期率和入催率在嗖嗖上涨。

  “此前我们去和公司谈,参与数据共享,大多人并不理会。”某个人征信试点的商务负责人程烨发现,最近这些公司对于“共享”积极了很多,甚至很多公司主动来敲门。

  共享平台们,已感知到共享意识的觉醒。

  目前,市面上有上百家数据共享平台,这其中分为几大类别。

  最早入场的是官方系。

  早在2009年,央行征信就正式控股上海资信有限公司。

  “业内都认为,上海资信是央行征信的补充,专门用来收集央行征信之外的借贷数据。”监管人士林海峰称。

  此外,还有一些有官方背景的协会,也成立过数据共享平台。

  比如中国支付清算协会下的,小微金融风险信息共享平台。

  第二派,是企业系,是各大公司自建的平台。

  比如中诚信、中智诚、京东金融、宜信旗下致诚信用的阿福平台、算话征信、同盾、91征信等平台。

  除此之外,还有一些有数据的支付公司、短信平台都纷纷做起了数据共享平台。

  “知名平台有30多家,大大小小的平台都算上得有100多家。”林海峰预估,这一切才是刚刚开始,未来将出现更多细分垂直的数据共享平台。

  而这一轮新的爆发,偶尔中也带有必然。

  中国的征信体系,在曲折中盘桓多年。

  2015年,国家正式开放了民间个人征信市场,号令枪一响,第一批试点的8家机构,开始撒丫狂奔。

  大家望穿秋水,等待着牌照,最终等来了却是监管的“全盘否定”。

  “8家进行个人征信开业准备的机构,目前没有一家合格。”中国人民银行征信管理局局长万存知在会议上称。

  两年探索,一夜归零。

  无疑,征信建设是一个漫长而风雪交加的征途,急不得。

  但互联网金融等不了。

  对于金融行业来说,征信太过重要,可节约大量风控成本。

  行业开始自救,市面陆续出现一批数据共享平台。

  在最早期,数据共享平台都喜欢收集“黑名单”,就是逾期数据。

  随着消费金融的普及,很多用户开始多头借贷,借新还旧,以贷养贷。

  黑名单数据开始“失效”。

  “2015年,网贷很火,平台几千家,导致行业的共债已非常严重。”致诚信用总经理赵卉称,过度负债的结局,有太多前车之鉴,比如韩国的信用卡危机、台湾的卡债风暴等。

  “债务会累积,像雪球一样越滚越大,等支撑不住崩盘的时候,债务危机才会集中爆发,一个好用户,也会突然间崩盘而不还钱。”林海峰称。

  说到底,借贷需要评判两个要素:还款能力和还款意愿。如果共债严重,就很难正确判断一个人的还款能力。

  不久,整个行业调转船头,从只收集“逾期数据”的黑名单,转到了收集借贷的“全周期数据”,以此缓解“多头借贷”严重的现状。

  “征信的精髓,就是共享。”林海峰称,因此,行业共享平台的建立,是必然,也是趋势。

  02 困难重重

  2016年下半年开始,数据共享平台大量出现,一时间行业百舸争流。

  但总体来说,发展不尽人意。

  先来说说官方派。

  因为是官方机构或半官方机构,吓得部分存在问题的公司不敢来共享。

  “谁能说自己是一张白纸,没有一点问题?”林海峰笑称。

  另一方面,因为官方派缺乏互联网基因,服务和运营意识并不太好,“前期共享完了,后期的服务体验不好”。

  而企业派,则是问题重重。

  林海峰注意到,大家做共享平台的出发目的,不太相同。

  “有一些是为了利益而来。”林海峰发现,一些平台的规则是,共享了数据的,查询不收费,但是其他公司要想来查,就得收费,“几毛到几块不等”。

  还有一部分,是为了数据而来。

  林海峰就曾经调查到,一家数据平台收集到数据后,再偷偷拿到各地的大数据交易中心去买卖。

  或者直接成立一家“关联公司”,在市面卖数据。

  还有一些玩家,当了裁判员,还同时当运动员。

  “一家头部的数据共享平台,公司负责人的直系亲属,又成立了一家贷款公司,拿着各家的金融数据再去放款。”程烨称,这在圈内,早就成为了公开秘密。

  因此,在最早期,金融公司并不太愿意共享数据。

  第一,他们也无法判断平台动机是否纯良;第二,数据是他们的“核心机密”,他们也不愿意拿出来。

  “谈一个共享用户太难,反反复复去磕。”程烨一度认为,共享在中国不太可能做起来,大家“自扫门前雪”的心态太严重,相互敌视,不信任。

  在如此利益交集的江湖,“相互不信任”,成为数据共享最大阻力。

  为了消除金融公司的顾虑,各家公司都打出了新的底牌。

  第一种方式,就是不需要金融公司上交数据,只要提供一个接口,每次有人查询时,直接反馈一个脱敏结果。

  但这依旧没有消除金融公司的顾虑,“这个接口是否安全?共享平台是否能以此为抓手,伸进底层数据库?谁都不敢保证。”程烨称。

  市面上有人提出了,用技术来解决。

  林海峰最近参加了很多大数据峰会,发现很多数据共享平台都在宣称用“区块链”的技术。

  他要求去看底层架构的时候,对方却变得支支吾吾。

  “很多都是噱头,区块链在共享平台运营还比较早期,真正走出模式来的,没几家。”林海峰对此也不乐观。

  “我们也加入了很多数据共享平台,但是调取平台数据的时候,发现效果很差。”某公司的数据模型负责人坦言。

  此后,他们再也没有加入过任何数据共享平台。

  数据的表现,为何不尽人意?

  “数据掺沙子的问题,一直存在。”致诚信用总经理赵卉称,很多金融公司的想法是,把一些好用户,杂糅到黑名单里,“他们以为,如此别人就无法抢走自己的用户”。

  “这就导致,很多平台的数据被污染,真假难辨,失效失真。”程烨称。

  建造平台目的不纯、相互不信任、数据造假等多种问题,整个数据共享行业都尚在迷雾中摸索。

  03 前路漫漫

  行业诸多问题叠加,实际上,无非就是要解决一个“公信力”问题。

  要建立公信力,出发的目的,就不能太功利。

  多位共享平台的负责人认为,数据共享,应该用“纯公益”的操作思路。

  “带有私心和目的,行业内的人都不会认。”小微金融风险信息共享平台的负责人透露。

  赵卉持有同样的观点,所以致诚阿福的数据共享,并不收费。

  “宜信的创始人、CEO唐宁在内部会议上,说要进行数据共享,大家都颇为反对,觉得这个事情吃力不讨好,很难做起来。”赵卉称,但唐宁很坚持,说这是对整个行业都有益处的事情,能够帮助整个行业降低风险。

  唐宁提出方案后的2016一年,都是“让行业机构免费来查宜信的数据”。直到2016年年底,致诚阿福的共享平台才成立。

  也就是说,他们花了一年多来教育市场,培育信任。

  “我一直相信六度空间理论,也就是说,你和任何一个陌生人之间所间隔的人不会超过六个,世界很小。”赵卉称,这个圈子很小,纸是包不住火的。

  “因此,永远不要作恶。”

  她在圈内听说一些大公司会数据“掺沙”,至今她都拒绝合作。

  同时,加强数据的交叉验证和审核,这一步也不可少。

  “我们对数据进行反查抽样,机器和人工交叉验证,一旦发现异常,就会深入查验。”赵卉认为,要爱惜羽毛,才能飞得更高更远。

  “现在已有数据查验模型,容易发现数据中掺的沙子。”赵卉称,她已清退了3家数据存在问题的公司。

  除了技术之外,还可通过制度来防止“数据造假”。

  一家加入信联的征信机构数据共享平台称,他们将在明年开放C端用户的数据查询。

  这个逻辑和查询央行征信很像。

  用户本人,可以去央行申请查询个人征信,如果发现逾期等负面记录有误,可以提出异议。

  这个方式可以让用户自行发现数据真伪。

  共享要用“公益”思维,但这件事情并非毫无想象力。

  一家金融公司不是光有数据,就可做好风控,还需要技术和经验。

  比如致诚阿福,就在共享平台后已布局了“群星”和“天迹”两套系统,给金融公司提供全业务流程的风控解决方案。

  前端,共享平台聚合行业,后端,又将宜信多年的经验输出。

  这样的商业模式,才足够智慧

  美国征信的建立,花了近百年的时间。

  中国征信出发才几年,前路漫漫。

  “数据共享必须沉下心来,重运营重服务重质量,才可能成。”林海峰称,因为数据是敏感资产,尚有不慎,就可能“走偏”。

  这里同样只欢迎深耕者,拒绝投机取巧的“揩油者”。

  (应受访者要求,本文部分人名为化名 。)

【本文为专栏作者授权投资界发表,文章版权归原作者所有。文章系作者个人观点,不代表投资界立场,转载请联系原作者获得授权。有任何疑问都请联系(editor@zero2ipo.com.cn)】

TOPS
  • 日排行/
  • 周排行/
  • 原创