2019年09月22日 星期日
首页>经历 > 正文

在数据中展现新闻的力量

2019-07-04 11:27:06

来源:青年记者2019年7月上   作者:孔家兴

摘要:制作数据新闻,如何找到有用的数据,让读者轻松读懂数据新闻的内容并获得一些新知?如何挖掘有价值的选题展现新闻的力量?如何讲好故事让结论更有说服性和解释力?

  每当有人问我是做什么的时候,我总会有一种不知该从何说起的感觉。

  并不是我不热爱自己的职业,而是我不想用只言片语去描述它,担心让人对它产生什么误解或刻板印象。

  我是一名数据新闻记者。

  在此之前,我是一个在广播、电视台、IPTV、新媒体都待过的广电新闻专业毕业生。那时的我像一个齿轮,周而复始地在巨大的机器里运转着。因为做的事情有些条条框框,我的好奇心和热情被慢慢地磨损了。有时我甚至想,新闻行业好像没有从前那样吸引我了。

  对于职业的迷茫,让我选择停下工作的脚步。在那段时而忙碌时而闲暇的时间里,我看了西蒙?罗杰斯写的《数据新闻大趋势》。这本讲述英国卫报数据新闻栏目作品的图书,深深吸引着我。那种感觉就好像看到一则重大新闻时会发出的感叹,让我充满了惊讶、好奇和想象。原来,新闻还可以这么做。

  抱着试试看的心态,我开始一点点学习如何做数据新闻以及可视化报道。大概用了半年的时间,学习了数据分析、前端编程、可视化设计等,但始终觉得自己是一个门外汉。带着诚惶诚恐的心情,我报名参加了财新传媒的第二届数据新闻大赛。出乎意料的是,我竟然拿了个三等奖。这在当时对我来说是一种莫大的鼓励,它更加坚定了我要从事数据新闻的信念。更幸运的是,因为比赛获奖,我加入了澎湃新闻的数据组。迈出的这一步,让我感受到了从未有过的坚实和力量。

  从“101”到“Making Maps”

  真正感受到数据新闻的魅力是在工作之后,在不同的阶段都会带给我不同的体验和思考。工作后接到的第一个选题是一则飞机失联的突发新闻,当时给我的任务是在大约两个小时的时间里找到飞机机型和历史事故的数据。我一边在浏览器里检索,一边浏览相关的报道,试图找到合适的数据源,可是找了很久都没有什么收获。时间一点点地过去,我感受到了巨大的压力。两个小时很快就过去了,我只找到了一部分数据,感觉很挫败。

  后来,找数据成了我工作中很重要的一部分。这个过程也印证了一句古话:“万事开头难。”工作后的一段时间里,我常常找不到数据,这也就意味着我根本无题可做。回想起来,没有数据的日子是痛苦的,却是最磨练人的。虽然很多时候没有找到数据,但我在这个过程中慢慢探索出找数据的方法。数据对我来说不只是数字、表格,它还可以是文字、地理信息、图片序列,结构化的信息都可以成为数据。这种观念的迭代,让我逐步找到寻找数据的方向。

  对于数据新闻来说,数据是“101”,是一切开始的地方。但这并不意味着有数据就能生产出好的内容。举一个简单的例子,国家发改委PPP项目库中公开了各省市区上报的PPP建设项目。从数据维度来看,它包括了项目建设的时间、项目负责人、项目投资的阶段和对应金额等,是一个非常好的公开数据。但是如果光把这些数据堆在一起做分析,得到的结论无非是哪个地方投资了更多的PPP项目,这些项目都是哪些类型的,投资金额哪个省比较多之类的。没有新闻节点作为支撑,与受众也并非有很强的接近性,就数据说数据的结果只能是作者在自嗨。

  还有一种迷思是我在工作之初就有的,那就是大数据和数据新闻的关系。在参加财新数据新闻大赛的时候,有一位学者曾经提出这样一个问题:数据新闻是不是就是大数据新闻?后来在一次合作项目中,我找到了答案。在这个项目中,我们想从外卖的数据分析一下夜经济的情况。合作方根据我们的数据需求,提取了大量的数据给我们。这些数据从数据量上确实已经达到了所谓的大数据级别,但是很多数据是无效的。这种无效体现在:从外卖单品的数量上无法体现用户究竟点的是什么东西。如果光从数据来看,北京人、海南人最喜欢吃的都是米饭,数据结论是无效的。所以数据量的大小并不是最关键的因素,还要衡量数据的质量,以及是否有解释的意义。

  在美国有很多读者喜欢看地图,按照一位数据新闻大牛的说法,“Making Maps”可以用来形容数据新闻内容生产初期的一种状态,用基本的信息传达,给读者他们想看的东西,这也是我在从事数据新闻工作中不断琢磨的地方。不论是内容的表达还是可视化的呈现,很多时候都是一个平衡的过程。过多的文字赘述可能是因为没有利用好可视化的批注;可视化的形式很新颖但读者可能看不懂;图表很复杂但呈现的信息量是有限的。最好的状态莫过于读者毫不费力地读懂数据新闻的内容,并从中得到一些新知。在调整这种平衡的过程中,数据新闻的魅力才会一点点彰显出来。

  展现数据新闻的力量

  除了理解数据,挖掘内容,在工作中我学到最多、提升最快的是前端技术。在我们团队中,不少记者有自己擅长的技术类型。有的同事有很强的利用“爬虫”的能力,可以抓取海量的数据。还有的同事能用各种不同的编程语言做数据分析,缩短清洗数据的时间。技术解放生产力,在数据新闻工作中是实实在在的。

  更有趣的是,我们在尝试新技术的过程中,创造出一些新的新闻产品。让我印象深刻的是2018年汶川地震十周年的时候,我们上线了一款UGC类的新闻交互应用《汶川记忆地图》。做这个产品的初衷是我们希望在汶川地震十周年之际,向读者展现中国人对于这场国难的记忆。我们通过建立数据库和前端页面,最后搜集了2500多份来自全国各地读者发来的汶川地震记忆。出乎我们意料的是,即便是像UGC这样填写门槛不高的项目,也有不少读者会很用心地写下大段的文字来表达内心的情感。在整个项目期中,我和同事们一边写代码迭代产品、上线新功能,一边抽时间阅读数据库里的故事。一边是理性的思考,一边是情感的碰撞,实在是一种很奇妙的体验。

  为了做好这个项目,我除了倾尽当时所有会的技术外,还“现学现卖”了不少新技术。虽然在之后代码评审(Code Review)的时候觉得代码写得并不优雅,很多地方不规范,也不是那么简洁,但是对于提高我的技术能力还是十分显著的。也就是从这个项目开始,我对数据库应用类的新闻产品有了全新的认识。这种认识除了开发层面的,还包括运营、传播层面,一个新闻项目能够获得更好的传播效果,需要解决的问题远比我想象的要多。

  推出这样一款新闻产品为我们团队赢得了不少荣誉,也获得了一些业内的认可。我在政治组的一位记者朋友曾经这么评价我们数据新闻组,说我们是一个“秀肌肉”的部门。从得奖的层面说,这些年我们团队虽然没有拿过头奖,但也很少缺席SND(世界新闻媒体视觉设计协会)新闻视觉设计大赛、凯度信息之美大赛、SOPA(亚洲出版协会)“卓越新闻奖”这些国际奖项。虽然我们的对手强如纽约时报、华盛顿邮报、华尔街日报等,但我们始终并不满足于拿回一个“安慰奖”。就像我们团队在工作总结中常说的,可能我们缺少的是那种很厉害的项目(Killing Project)。而找到这样一个项目,不是光靠秀技术就可以实现的。

  曾经我会陷入一种沉迷学习技术的状态,认为学好了技术就能够解决很多问题,忽视了对于内容和选题的挖掘和积累。在数据新闻工作中,拥抱技术是理所应当的,但技术本身不是万能的。它的定位应该是为内容创作服务,为实现好的想法和策划服务。但技术本身又是十分重要的,它决定了一个好的想法能够在多大程度上被不打折扣地表现出来,或者一个选题有多少操作性。说到底,这还是一个平衡的过程。

  用数据讲好故事

  回归本质来看,我们在工作中不断学习的是如何用数据讲好故事。为了做好这一点,我们团队中每一位都可以说不遗余力。

  去年夏天我们为了能够弄清楚上海的相亲市场,花了6个周末的时间,通过一次次实地的采访调查,构建了上海相亲角的数据库。我依稀记得同事们为了构建这样一个数据库,在炎炎夏日多次赴上海相亲角。一边与那里的叔叔阿姨们周旋,一边低调地“搜集”贴在雨伞上的相亲广告。在获得素材后,同事们又花了大量的时间把照片中的文本信息提炼成数据维度,在筛选后凝练出一个包含874份相亲广告的数据集。

  我们在这个数据集的基础上,制作了两个不同的数据新闻产品。一个是偏数据库应用类的交互项目,用户可以通过输入自己的条件和需求找到相亲中对自己感兴趣或自己想寻觅的人。另一个是主打可视化展示和分析的交互项目,从数据库本身出发分析当下上海相亲角中的一些特征。比如,男性在样本的年龄分布上会比女性更加平均一些;男性偏爱找年龄比自己小的女性,而女性的年龄要求则更分散;男性几乎不要求女性有房产,但比女性更看重是否有上海户口等。这些有趣的结论是之前我们从任何数据源中都不曾得到过的。

  相亲角的例子其实是想说明,为了讲好数据故事,数据新闻记者也能奔赴现场去进行数据采集和数据集构建。这种操作方式与我刚工作时对数据新闻记者的认识有很大的不同,我的印象里从事这份工作的都是一个个默默在电脑屏幕后面与数据叫板的“技术宅”。但是,在合适的条件下,数据新闻记者在数据的获取上也可以变得更加主动。

  有时为了讲好数据故事,我们看的文字比数字还要多。今年上半年我们一位同事在做一个关于政府信息公开的选题,由于作为数据样本的裁判文书数量巨大,她不得不翻阅了很多文书。虽然从分析的角度,抽样也能得出一定的结论,但她为了讲好故事,几乎把这些文书都看了个遍。一方面,她从大量的阅读中找到了一个动人的故事,成为她的报道中叙事的切入点;另一方面,她全面地分析样本,通过聚类得到的一些结论和要点更加有说服性和解释力。

  数据新闻在中国并不是媒体的标配,它对于很多媒体来说是一种奢侈品。在内容生产上,它既不高效,又有很高的门槛。它时而被人误解,时而令人费解。做这个的社群本来就不大,来来往往都是这些人在做数据新闻,出圈并不是一件容易的事。再说数据公开,国内的数据大多在政府部门和商业机构手里,并不都是容易获取的。

  即便如此,还是有一些人为了发掘它的价值,为了彰显它的魅力,为了让更多人了解它而辛勤耕耘着。我很荣幸自己能够成为其中的一分子,希望再有人问起我的职业时,我不再踌躇。

  (作者为澎湃新闻“美数课”栏目记者)

来源:青年记者2019年7月上

编辑:范君