对于 大数据 征信而言,数据的来源主要源于政府、金融机构和民营企业。
不过相对而言,中国大部分的核心数据掌握在政府部门手中,对判断个人与企业信用至关重要的相关数据亦在其中。以往这些数据大多处于沉睡状态,但是现在,越来越多的数据正在被想方设法开放出来。
这或许会给 大数据 征信带来新的变化。
关于 大数据 征信,网易 科技 此前已经对行业规模及参与者做了深入报道,详情请查阅:
征信系列报道(6):市场能过千亿吗
征信系列报道(5):独立第三方征信怎么做
大数据 征信系列报道(4):金融系 大数据 征信疾进
大数据 征信系列报道(3):不拼技术的考拉征信
大数据 征信系列报道(2):芝麻信用如何破题
大数据 征信系列报道(1):华道征信如何运作?
文/温泉
11月26日下午4点,完成了当天的授课之后,复旦大学国际关系与公共事务学院副教授郑磊匆匆打车赶往机常
他要搭乘当天的飞机赶到北京,参加第二天国家信息中心举办的开放数据的交流会,周末还要参加在清华大学举办的 大数据 研讨会。
郑磊还有一个职务是“复旦大学数字与移动治理实验室主任”,这个实验室成立于2010年,致力于对政府治理在数字时代所面临的新机遇和新问题进行应用型实验和研究。这两年来,这个实验室发表了一系列关于开放数据的研究成果,郑磊也逐渐参与到各地的数据开放探索当中。
意愿和能力都有问题
让政府开放数据,并不是一件容易的事。
以中国最早的征信企业之一——中诚信征信为例。中诚信征信业务起步于2002年,其内部有一个专门的部门负责收集信息。10年来,这个部门收集的数据覆盖了约3000万家企业和逾1亿自然人,但是有合作关系的政府部门仅仅集中在东部一些经济较发达的地区。
中诚信征信执行董事孔令强告诉网易 科技 ,就采集政府职能部门信息而言,身份认证和学籍学历信息基本全国统一,只要和相关部门商谈就可以,其他很多部门的信息是分省或者分地区的,得和各个省或地区分别谈。以往每个省市要想统筹本地区各个部门的信息也非常困难,因此这样的合作需要和各个部门分别谈。
中国软件评测中心从2002年开始做政府网站绩效评估,中国软件评测中心副主任张少彤参与这项工作十多年。他向网易 科技 总结,现在政府网站公开的70%—80%的信息都是“文章类信息”,而非数据。这些“文章类信息”大致可以分为三类:一类是包括工作动态、地方要闻、领导活动等带有新闻属性的信息;一类是地方发文、人事任免、招投标、财政等文件类信息;一类是办事信息,比如行政审批、公共服务指南等。
“即使是公开的数据,一般也是宏观经济运行的数据,比如GDP这类宏观数字,现在还没有深入到企业和个人的具体信息这个层面。”张少彤对网易 科技 坦言。
对于政府数据开放程度不高的原因,多位受访者都认为,这其中既有意愿问题,也有能力问题。
“信息就是权力,谁掌握关键信息,谁就掌握权力。数据和职能是相关的,有哪些信息,就意味着你能发挥多大作用。”国家行政学院公管教研部副研究员何哲向网易 科技 指出。本部门的信息掌握程度,往往决定了本部门在整个社会和政府内部链条中的作用和地位,因此,从各自利益出发,每个部门都希望将信息牢牢控制在自己手中,从而增加自身在整个体系内的地位和增大与其他部门的博弈能力。
很多时候,这样的公开还意味着权力要接受监督,这更增加了开放数据的阻力。上海金融与法律研究院研究员聂日明向网易 科技 举例:“别的不说,你就单看一个‘三公经费’的公开,就让多少政府部门感到狼狈。再比如,政府的失业保险、最低生活保障经费都发给了谁,这恐怕是很多地方都不敢公开的。”
主动公开的意愿不足之外,强制性的压力也不够。2014年年末,新华社参编部曾经做过一组关于 大数据 产业发展的调研,这次调研的成果曾经发表在《经济参考报》上。当时一位参与调研的新华社记者告诉网易 科技 ,采访到最后发现,每个部门背后都站着一部法律,比如统计有统计法,工商有工商法,这些部门法规就要求有的数据是不能公开的。相反,要求数据公开的法律到目前为止只有一部从2008年开始实施的《政府信息公开条例》,这个条例还没有部门法规的立法层级高,一旦发生矛盾,都是按照更高层级的法律处理问题,数据开放的要求往往会败下阵来。“开放数据,需要进行整个体系的全面调整,需要进行专门立法。但是,这部法律的制定,目前争议很大。”他告诉网易 科技 。
除了意愿,还有能力问题。张少彤告诉网易 科技 ,如果数据要公开到企业和个人的层面,专业性就比较强了,哪些数据可以公开、哪些数据不能公开就需要理清楚,而要弄清楚这些问题就要懂得相关业务,国家没法像要求政府信息公开一样,出一个普遍的强制性法律,必须具体问题具体分析,因为这涉及到国家 安全 、企业商业秘密和个人隐私。“这方面目前还没有相关的标准,还在探讨当中。”他说。
经济增长转型促进数据开放
然而,尽管开放数据的阻力和困难一大堆,郑磊这两年看到的,却是越来越多的地方在尝试开放政府数据,比较典型的是北京、上海和广东省佛山市南海区。
他本人就亲自参与了上海市“开放数据三年规划”的制定,这个课题已经做了一年,将于今年12月底结题。
他告诉网易 科技 ,现在上海市准备推出一个开放数据的“正面清单”,就是把“哪些数据可以开放”列出来。设想中,三年以后,上海市可能会推出一个“负面清单”,就是把“哪些数据不能开放”列出来,其他数据都要开放。