涂子沛涂子沛,著名信息管理专家、科技作家,《大数据》、《数据之巅》作者。近日正式加入阿里巴巴集团出任副总裁。

数据开放与公民精神

2012-12-01北京
大数据对我们这个国家来说,与其说是一个机遇,还不如说是个挑战。我们这个民族就很可能在这个数据的、全球的数据竞争当中再次落后、再次落败。
  • 2076
  • 7

已有7条评论

加载中...
分享到微信 如果您需要分享到微信,请用微信扫一扫,扫描下方二维码,再进行分享
查看完整演讲稿
TOP
© 2014 一席. 京ICP备13001689号-1
Τ¸Τ 您还没有登录哦 登录后才能使用喜爱、评论和收藏的功能 请在导航栏处登录或注册 感谢! 关闭
oops,这里有点问题 关闭

数据开放与公民精神

涂子沛 2012-12-01

在云计算之后,全世界出现了一个新的、非常重要的技术浪潮,它就是大数据。这个现象引起了全球的关注和讨论,这也是我今天来到这里和大家一起分享的一个原因。

大数据是指我们人类社会发展到今天,我们累积了难以想象的、前所未有的数据,而且我们人类分析数据、使用数据的能力,前所未有的增强了。能够从数据当中发现新的知识、新的价值,挖掘出新的利润。我们说这个「大」,不仅是指大的容量,它也指大的价值。

今天数据已经无处不在了,我们的衣食住行,我们的喜怒哀乐、吃喝玩乐,都以数据的形式存在。通过数据,我们通过软件、通过网络,用数据来记录这个世界,再通过数据,我们去研究数据,重新去发现这个世界。

数据,已经成为我们这个时代一个新的支点。而且越来越多的人认为,大数据是我们全世界下一个创新和发展的前沿。还有人把这个比喻为下一个社会发展阶段的石油和金矿。

这是一个转型的时代,一个大时代,任何一个时代的转型,都是一种机遇。你把机遇抓住了,就可能会成为一个竞争的优势。无论是企业,还是一个国家,如果失去了,就会成为一个新的落后的理由。

我们要承认的是,中国这个国家是一个数据文化比较匮乏、数据质量比较低、数据公信力不高的国家。这不是我一个人的看法。很早的时候,胡适有一篇文章叫「差不多先生」,他说我们中国人,我们是个「差不多先生」,我们不追求精确,习惯于差不多、模棱两可。还有

外国人形容我们更为直接:中国人是一个漠视精确、思维含混的这样一个民族。

前几天,我在清华大学参加一个研讨会,有位教授提到,他说数据的匿乏、数据的质量低,已经成为了中国学术发展的一个瓶颈。我们有好的文章,当我们提交到世界上之后,别人不相信我们的数据。这就好像有一个好的厨师做出了很精美的糕点、很可口的糕点,但是却被别人质疑因为材料不好。这是件非常可悲的事情,你连参赛的资格都失去了。

所以说大数据,对我们这个国家来说,与其说是一个机遇,还不如说是个挑战。我们这个民族就很可能在这个数据的、全球的数据竞争当中再次落后、再次落败。也正是基于这种焦虑感,还有一种责任感,我在海外就写了「大数据」这本书。

我来到这里的另外一个原因,是因为我很喜欢这个活动的主题「人文,科技,白日梦」。

人文和科技有没有关系?我认为是有的,科技需要创新,创新需要滋生新思想的土壤,需要一种文化氛围。所以归根结底,你有没有创新的能力,其实是一个文化的问题。我也一直相信,科技能够让生活变得更加美好,但是有一个前提,那就是我们要有一个正确的价值观,一个积极的人文精神和人文关怀。

我们说大数据时代,我们面临的问题跟这个很相似,我们要收集数据,然后使用数据,然后最后我们要开放数据,让数据自由地流动,让数据自由地整合,让别人也能使用这个数据,就是数据共享、数据开放。

从人文的角度来看,我认为收集数据是一种意识,使用数据是一种习惯,开放数据则是一种态度。谈到开放数据的时候,我要提醒大家注意的是,我说的不是开放你的数据,我说的是开放政府的数据、开放企业的数据。

开放数据在中国真的是一个问题,为什么?我们中国往往是不该开放的数据开放了,你的数据被开放了,你的电话号码被开放了,你的家庭住址被开放了,但是政府的数据、企业的数据被紧紧地封锁着。所以我们今天在这里讨论的是,开放政府的数据,开放企业的数据。

我们讲到开放的时候,我们首先要知道;开放,不等于公开;公开和开放是两个概念。

你今天去超市,你去京客隆,你看到这支翻页笔10块钱,这个数据是公开的。但它不是开放的,什么叫开放呢、当京客隆把它所有产品的价格以电子的格式放到互联网上,第三方可以自由使用的时候,那才是开放的。

我们可以继续设想,当所有的超市都把所有的价格以电子格式放在互联网上会出现什么情况呢?如果你今天去购物,你用智能手机的话,很快就能扫描一个产品。你能发现,这个东西在京客隆卖多少钱,在沃尔玛卖多少钱,在家乐福卖多少钱。它会让你的购物决策变得更加

科学,更加符合你的需要。所以说,这才是开放。

我们说,公开是信息层面的,是一条一条的开放是数据层面的,是一片一片的而且以电子格式推到网上。我们以后再谈到数据的时候,大家要记住,开放,不是公开,我们需要的是开放数据。

然后第二,开放,也不完全等同于免费。

我们说政府的数据应该免费,它用的是我们纳税人的钱,收集的是我们纳税人的数据,它应该免费提供给我们使用。但是企业,数据对它来说是个资产,它可以免费它可以提供出来,让大家使用,但是以收费的形式促进数据的、在这个社会的自由流动。

然后我们说,开放也是有层次的,它可以对个人开放对组织开放,也可以对全社会来开放。我们举几个例子,我们回到刚才你在京客隆购物的例子,你消费了很多,它留下了很多消费记录,它在挖掘你的消费记录,寻找你的购物偏好。

但是我们要问。京客隆有没有一个义务向我们开放数据呢,把我的消费记录通过一个窗口,让我来看看,让我下载;我们用信用卡天天刷卡,信用卡公司有没有义务给我们提供一个窗口,让我们下载自己的消费记录呢?这些记录是有价值的,是可以分析的,因为很多国家已经出现了这种分析的软件。

例如,你的消费记录,分析你的消费记录,它可以给你提出更科学的消费建议,告诉你在哪里买到,更好的东西、更便宜的东西、更实用的东西。它可以从你的消费记录中,看到你的生活健不健康,你上个月也许买多了很多高能量的东西、卡路里过高的东西,它可以给你提出很多建议,这些数据会产生价值。

再例如,我们每个人都在发微博,用新浪微博,用腾讯微博。我们发的这些微博,我们想不想保存呢?新浪是不是应该给我们开个窗口让我们自由下载,对不对?它应不应该这么做?这是我们的权利,已经有人提出来这是数据权;这也是你,还有一个新的名词叫数据遗产

这是你生活的一部分。你发了那么多微博它应该提供一个窗口让你来下载。

我们说,数据开放绝对不是一个局部的现象,现在全世界有三十多个国家在开放数据。大家也千万不要认为,数据开放是发达国家的事情。大家可以看到,非洲的很多国家,包括肯尼亚,也在开放数据,就是说我们有很多很多的数据需要开放。

当然,全面地开放数据,系统性地开放数据,是需要一个顶层设计的。也就是说,需要制度保障。但是,我们要知道,任何一个运动的开始,一定是由下至上、由点至面这样产生。也就是说数据开放的运动,它是始于民间的,始于社会的,始于我们在座的每一个人的。这也是我在美国、在英国观察到的,都是这样。

我在「大数据」这本书里面,曾经讲到过一个例子,一个美国白宫的例子。美国白宫是总统

居住和办公的地方,因为它是用纳税人的钱供养,所以它也叫「人民的白房子」,从这个意义上来说,我们的人民大会堂,也有点像。

白宫是开放的,也就是说普通民众可以去那里参观,在网上也有各种各样的程序,你可以360度地去浏览白宫的每一个角落,包括奥巴马的办公室。白宫也有开放日,也有开放日。

这是奥巴马接见一个普通家庭时留下的一个照片。一个黑人的孩子,他很好奇奥巴马的头发是不是跟他的一样,奥巴马就弯下身来让他抚摸。我们说,在这里看到了奥巴马的谦卑,这是一个民主体制下一个国家领导人,应该具备的一个这样的姿态。

奥巴马第一次当选总统之后呢,发生了一件事情,什么事情呢?有人提出来,说人民有权利知道你每天在干什么,你每天在见谁,谁访问了白宫。这背后有个潜台词,潜台词是什么呢?就是说,谁在影响国家政策的制定,谁在影响奥巴马的决策?你知道,进白宫的时候是必须登记的,就像我们很多国家机关有一个数据库,它专门去记录这些数据。

然后华盛顿就有个公益组织,叫华盛顿责任道德公民中心,它的主任是一个叫斯隆的女性。斯隆就提出来白宫应该开放这部分数据,让美国的全社会都知道美国总统在干什么,谁在影响美国总统。当然,当她提出这个要求之后,白宫的第一反应是拒绝,但是斯隆她不屈不挠,她最后提起了诉讼,她把白宫送上了法庭,她说你应该开放这部分数据。

经过了一个很长的、很曲折的努力过程,在2009年3月的时候,奥巴马亲自宣布,我向全社会开放这部分数据。我们能看到这是白宫访客记录开放之后,这个记录有37个。数据项,美国白宫已经开放了一百多万条访客到往白宫的记录。

接下来我们可以看到这是美国民间开发的一个应用,它能查阅、统计各种不同样的人访问白宫的次数、时间、地点,在那里停留的、停留的长度、议题是什么。这些应用也可以跟维基百科,很多新的应用整合起来直接调用、查看这些访问人员的履历和简介。

这是斯隆,她就是华盛顿责任道德公民中心的主任,她创建了这个组织,这是一个只有十几个人的组织,但它推动了一项数据的开放。这个组织的使命陈述中,有一段话我非常非常的感动,她在谈到为什么要推动这件事情的时候,她就说:我们每天打开报纸,读到那些负面新闻的时候,她就想,太糟糕了,为什么没有人出来做点事情?她不仅仅是想,她放下报纸,她这就去做。

这是这个组织的一个使命陈述,这个使命陈述是这么说的:永远不要怀疑那一小部分有思想,并且执著努力的人能改变这个世界,而且我们要回头看,人类的历史从来都是这样。

我后来把这个故事写进了「大数据」这本书,我想通过这个故事提醒我自己,也提醒我的读者,做一个执著的公民,这个世界会因为你而改变,只要你积极,只要你执著,只要你有想法。

我们刚才讲的这个故事,是一个关于透明政府的故事。在今天,透明中国、透明政府,重不重要呢?在中国我们知道,透明营造信任,更多的透明营造更多的信任。我们今天的中国是一个信任极度极度匮乏的国家。回到数据开放上来,不仅是,透明政府、数据开放,它不仅仅意味着信任,还意味创新,意味着推动知识经济。

网络经济的发展,让我们这个社会从粗放型管理,迈向精细化管理。我这次回国在很多地方做座谈、做演讲,少不了飞来飞去,跟很多人一样。我经历了几次航班延误,当进入航班延误,你不知道自己要等多久的时候,你的情绪突然变得非常非常不美好。

美国社会怎么解决这个问题呢?开放数据。它开放了所有的航班,起飞的时间,落地的时间。然后就民间有人对这些数据进行分析,你在乘坐任何一个航班的时候,你都可以找到每个时间点上,周一、下雪的天气、下雨的天气、节假日,这趟航班它晚不晚点?它平均晚点多少。

通过这种数据开放,它解决了一个问题。它推动了各个航空公司的有序的这种经济的竞争,它让消费者能找到合适于自己的航班,最重要的是什么,它把一种稳定的秩序一种稳定感传递给了消费者,当你等待的时间变得可以预期,当你的生活可以自己去掌握,你的生活才可能变得更加美好。

这是我今天分享的故事、经历和思考,我希望更多的人来关心科技、关心文化、关心数据开放、关心我们的公民社会、关心那些我们在全世界很多地方都已经实现了的,但在我们这片土地上还是一个白日梦的那些思想。

最后,我想跟大家分享这样一段话,奥巴马当时去参加一个毕业典礼,他对毕业生说:

你们每个人拿了毕业证,都可以走下这个讲台,去追求好吃的、好喝的,去追求这个金钱社会理所当然可以追求的东西;你可以选择只关心自己的事情,把自己的生活跟别人的生活,跟社会的发展,跟国家的发展割裂开来。

但是我不希望你这么做,这是因为,你对自己负有责任;这是因为,我们每个人个人的命运,是依赖群体的命运的;这是因为,如果你仅仅考虑你自己满足眼前的需要,这是一种贫乏;这是因为,你只有把你的战车、自己的战车,和其他一些更伟大的事情联系到一起的时候,你才能为这个国家的发展,找到你在历史的演进当中所能扮演的一个角色。

这是奥巴马说的,我想说的是,科技和人文是有关系的。如果它们正确地结合,一定会让我们的生活,变得更加美好,不要让那些美好的思想,永远只停留在白日梦上。

做一个积极的公民,执著地努力,让开放数据等等美好的事情,在我们这片土地上,在我们这个国家,在我们这代人的手里,变为现实。