資料不能只是一小撮人在玩的遊戲,它必須是滲透到整個新聞業的


(圖二,照片來源,the data journalism handbook)

 

  每天都在看新聞的你,知道 2015 年將發生的聖嬰現象,可能會增加美國人接受氣候變遷是一個事實的比例嗎?或者,你覺得 2044年時,大部份的美國人就會反對死刑?如果你回答「是」,我有95%的信心告訴你,你正在跟隨著近來火熱的「資料新聞學」與「解釋新聞學」話題。我說的是,例如像是 「fivethirtyeight.com」 或 「vox.com」 這類網站;像是「紐約時報」的 「nytimes.com/upshot」,都正在努力提供或強化既有的資料服務。

 

  新聞記者一向具有新聞鼻,敏感於數字或統計方法,其中佼佼者甚至非常自豪自己這項能力。不過,也有許多新聞同業,還是會犯一些錯誤,不是同樣問題,在問了很多人之後,就直接把他們的答案報導出來;正確作法應是去衡量其呈現的證據,然後指出哪一個意見才是較為可信的。

 

  資料新聞學的興起,意味它要來解決,過去傳統新聞室裡,潛藏太多不正確資料的問題,這些問題,有時候不僅僅只是記者的錯誤,可能還要把責任歸於編輯群。然而,話說回來,這一波資料新聞學的流行,並不意味著能解決所有事情。就如同第一段裡我所提及的這些網站,有時它們所呈現的資料,也可能是破壞它們本身所遵從的報導原則。

 

  所以,到底是什麼問題?可以從以下五個方面說明:

 

  第一,有些新聞會錯誤連結特定例子與研究結果,藉以支持一個想法。比如,我大可找出只舉一些特例或簡單連結的報告,就說「注射疫苗會導致自閉症」,當然,這是不對的,因為他們可能僅憑一些大敘述或理論進行論述,卻缺乏了更多實證的資料來支持。

 

  第二,有些新聞工作者會粗心地使用了「代理變數」,比如:你不能主張現在社會有很多「綁架案」,是因為媒體正在報很多這類的故事;你只能說,目前媒體比較關注這類新聞而已。如果你要如此主張,恐怕必須更多分析才行。

 

  第三,非線性成長或衰退的現象,如果被新聞工作者解讀成可預測性的線性發展趨勢,也是錯誤的。比如我們要去預測到了2044年支持廢死刑的人口有多少?其實沒有多大意義。事實上,很多事件參雜了許多混淆變數 (confounding variables) 的,或者我們不知道我們有所不知(unknown unknowns),甚至是一些根本無法預測的但是會發生的事件(Black Swans)等等,就能說明簡單預測的盲點。這就如同你不能說,一個女生昨天是0個丈夫,今天結婚是1個丈夫,然後預測下個月她會有48個丈夫一樣。很多預測是缺乏常識的。

 

  第四,關於2015年的聖嬰現象,是否會讓更多美國人接受氣候變遷是一個事實的問題,其實沒有答案,或許是,或許不是,但我們不可能知道。Upshot 網站說 : 「當全球溫度破紀錄達到最高時,相信有暖化現象的人增多;但在叫寒冷的幾年,相信暖化者變少。」其實,支持這句話的證據並沒有充分揭露,因此我們無法知道「增多」是否相關或顯著,或者僅僅純粹是雜聲。

 

  第五,有時候新聞報導會呈現簡單的長條圖,即進行推論並預測未來可能會發生什麼事或事件會怎樣發展。有時候,「魔鬼都藏在細節裡」,不可不慎。

                                                  
  因此,資料新聞學有危機了嗎?主要的挑戰難度在於,這類型網站在尚未運作前,過度承諾讀者;等到真正公諸於世之後,又(尚)未達到目標。資料新聞學強調根據嚴謹的事實與資料思考來進行報導,不過這類網站提供的故事,在證據力上稍微薄弱。作為一名讀者,我有下列建議:

 

  第一,資料或解釋新聞學不能夠便宜行事。要從事資料新聞學,如果只是想要用小團隊便宜行事,是很難做好的。本來,傳統新聞,本就會重視量化的方法與視覺化。1973 年,北卡羅萊納大學已退休教授菲利浦.梅爾(Philip Meyer)曾提出「精確新聞」(precision journalism) 一詞,提倡將社會科學的方法,應用到新聞實務上。例如,1993年,麥雅米.赫羅德(Miami Herald)因一個調查報導而獲得普立茲獎。該報導是關於為何安卓龍捲風在邁阿密與荷姆斯德兩個鄰近地區橫掃遍野式地破壞,而其他地區卻幾乎平靜如常。這與洛城區域檢查與建物品質標準有關,而他的調查是根據資料庫與地圖的比對,當然還有精細務實的報導。在新聞媒體組織中,調查記者與視覺設計者,始終不能夠孤軍奮戰;如有需要時,他們甚至必須仰賴大量的官方資料建置,以提供資金、支援與法律協助。

 

  第二,資料或解釋新聞學不能夠急促產製。這類網站的營運,仍以吸引最多數閱聽眾的眼球為目標,所以常會不停地在產製新聞故事或部落格文章,然後不斷進行解釋。這裡會有一個大風險:你會讓資料新聞網站的風格,走向結合社群化資訊網站(如 BuzzFeed)與專業財經網站(如 The Economist)兩者,而忘卻了本來資料新聞網站真正的目的。如果只是一小撮人在做資料新聞,很有可能就會製造出很多品質堪憂的東西或者只是刊登出少部分的優秀新聞故事而已。

 

  第三,部分的閱聽眾知道的比記者多。資料新聞學通常是立基在公開、可取得的資料庫。況且,當前對於新聞透明度的要求是,記者本身要揭露資料來源,以及將試算表單等資料放到網站上供閱聽眾下載、檢閱等。最後,由於資料新聞本身的特性,閱聽眾閱讀時,想必也會相當具有數字感。其實,為數不少的閱聽眾是比記者更熟知這些資料的,而且,他們也會有自己的方式,即時傳播出去。

 

  第四,擔任資料新聞記者不能閉門造車。一般認為,記者的身份,就像是狐狸一樣,他必須懂得很多方面的事物,但不需要特別專注在某一個領域。沒有錯,從某個角度來說,這是好的,可因此讓報導更豐富與生動。然而,對於資料新聞記者而言,是有點問題的,因為你無法再套用一個模板,就把意義從資料當中萃取出來。

 

  你必須深入理解,資料從何而來;它們如何被取得、過濾、處理,然後,它們本身的優勢與弱點和在。這也就是為何在大學裡,理工科系,如遺傳學、心理學、天文學與物理學等學科,要訓練自己學生統計能力,而非用透過社會學觀察法而來的統計資料。總之,記者需要專家輔助,這不僅僅只是去問一堆研究人員問題(很多資料網站甚至缺乏引用專家的見解),還包括與這些專家合作共同撰寫新聞內容,因為他們才是最了解資料特性的人。記者本身應當視與專家合作為常態工作。

                                                  
  無疑地,資料新聞學是一個新的現象,最近漸漸受到主流閱聽眾市場的關注,到達眾人期待的巔峰;接著,就急遽地往下發展、滑到谷底。預期它會很快進入到最後階段–穩定與量產的階段。

 

  總之,新聞需要更強而嚴謹與具科學的證據支持。資料不能只是一小撮人在玩的遊戲,它必須是滲透到整個新聞業的;而刻正從事資料與解釋新聞學的組織機構,可以協助達到目標。因此,從事資料與解釋新聞學的組織,應該更堅守在自己的目標,精進成長。最後,仍要提醒,誠如弗雷德.莫斯特勒(Fred Mosteller)所言:「我們很容易與統計資料共處,可是我們也很容易忽視它們。」同時,當你不知道如何衡量質性或量性資料的時候,請你記住,理查德‧費曼(Richard Feynman)說,「第一要務就是,不可以愚弄你自己,然後成為最輕易愚弄別人的人。」

 

原文資料:http://www.niemanlab.org/2014/07/alberto-cairo-data-journalism-needs-to-up-its-own-standards/

延伸閱讀:
What the Fox Knows, http://fivethirtyeight.com/features/what-the-fox-knows/