尼曼新聞實驗室：普立茲獎得主首次揭露其在報導中使用人工智慧

2024 年 06 月 6 日 | 卓越新聞電子報

郭宇璇｜特約記者編譯報導

2024普立茲新聞獎（Pulitzer Prizes）於5月6日公布，這也是首次有得主揭露其有使用AI人工智慧來製作他們的報導。哈佛大學尼曼新聞實驗室（Nieman Lab）採訪了獲獎的記者，以了解他們如何將機器學習融入他們的調查，以及其他媒體可以從中學習到什麼。

本屆普立茲獎共有15個獎項，其中有兩個得主使用AI製作報導。「我們沒有現成的先例，」普立茲獎評委會主席米勒（Marjorie Miller）表示，「先前的數據顯示，獲獎者可能使用了低層級（low-level）的機器學習應用。這是我們第一次明確提出這個問題。」

今年是普立茲獎首次要求報名者揭露AI的使用情況。根據尼曼新聞實驗室3月的報導，在45名入圍者中，有五人揭露了其在研究、報導或說明他們的作品時有使用AI。當對生成式AI的炒作和恐懼循環（hype and fear cycles）在各地的新聞媒體輪番上演時，將機器學習用於調查報導，實際上已成為決賽入圍者中代表性最強的一種技術。

地方報導獎得獎作品《失蹤於芝加哥》（Missing in Chicago），作者來自非營利新聞組織城市通訊社（City Bureau）和隱形研究所（Invisible Institute），他們訓練了一個客製化的機器學習工具，來爬梳數千個警察不當行為的檔案。《紐約時報》為國際報導獎的獲獎團隊，在其中一篇報導中，《紐約時報》視覺調查小組訓練了一個模型，在加薩走廊被標記為平民安全的區域內，識別出2000磅重的炸彈坑。

米勒也說明了使用AI的其他三個參賽者。分別為報導佛羅里達州一個大型退休社區的報紙《The Villages Daily Sun》，其製作的關於政府應對颶風「伊恩」（Ian）的地方新聞系列報導；彭博社（Bloomberg）關於美國政府如何助長槍支暴力在全球蔓延的調查報導，以及其關於水利行業暴利的解釋性報導。

從在地社區出發的資料新聞

獲得地方報導獎的《失蹤於芝加哥》，該系列報導揭露了芝加哥警察局（CPD）在調查失蹤和遇害黑人婦女時的系統性失誤。作者城市通訊社和隱形研究所歷時多年完成此作品，一款名為茱蒂（Judy）的機器學習工具在過程中扮演重要角色。

隱形研究所數據總監泰勒（Trina Reynolds-Tyler）說：「我們使用機器學習來解析警察不當行為記錄中的文本，特別是那些有描述性內容的文件類型。」她與城市通訊社記者康威（Sarah Conway）共同分享此獎項。

隱形研究所致力於處理根據法院命令公佈的數千份市警察局不當行為檔案，這些檔案的時間跨度從 2011 年到 2015 年。泰勒於2021年著手建立的「茱蒂」為該專案的一部份。泰勒也讓芝加哥社區成員參與茱蒂的開發過程，最終有200名志工閱讀並手動標注了這些不當行為檔案，建立了茱蒂的訓練資料庫。

雖然他們可能不是AI專家，但泰勒相信，在地社區的人們對芝加哥警察局的資料有既有的理解。即使他們無法用語言描述機器學習演算法，但他們的生活經驗是外包的資料編碼員無法比擬的。最終，茱蒂在四年中找出了54項與失蹤人員相關的警察不當行為指控。

在他們獲得普立茲獎的作品中，這54起案件成為指引泰勒和康威其他報導的路線圖。這些案件證實了，那些近年來有親人失蹤的家庭所遭受的痛苦和被忽視。這證明了這些案件並非孤立事件，而是芝加哥警察局系統性失誤歷史的一部分。

泰勒希望其他仰賴機器學習工具的記者，能夠理解深入他們所報導的社區的價值，並將他們的資料分析工作建立在真實的地方和人們身上。「我們必須致力於讓人們與我們一起走向未來。」泰勒在談到將AI用於調查報導時表示，「他們可以幫助你找到需要關注的地方，並讓你在理解的過程中有更深度的探索。」

找到AI訓練模式

在國際報導類別中，《紐約時報》視覺調查小組於2023年12月的一篇報導，是關於加薩戰爭的多篇受認可的報導之一。這支獲得普立茲獎的團隊訓練了一個工具，可以辨識以色列武器庫中最大的2000磅炸彈留下的彈坑。《紐約時報》利用該工具審查衛星影像，確認以色列軍隊在加薩南部投下了數百枚這種炸彈，尤其是在被標示為安全區的地區。

「有許多AI工具基本上只是強大的模式辨識器（pattern-recognizers）。」團隊中的記者、專門從事運算報導方法（computational reporting methods）的賈維里（Ishaan Jhaveri）說道。他解釋，如果需要為調查項目梳理大量材料，可以訓練一個AI演算法以指定模式辨識資料。這可能是在數小時的錄音檔中某人的聲音、在大量OSHA違規報告中描述的特定場景；或者在這個案例中，是使用空拍照片中的彈坑輪廓。

賈維里表示，團隊決定使用最適合他們調查主題的物體檢測演算法。他們使用一個第三方平台Picterra來訓練這個演算法。他們在上傳到平台的衛星影像中，手動選擇彈坑，逐步訓練Picterra能自動完成大規模的相同工作。

選擇Picterra的一個優勢，是它強大的計算能力。賈維里表示，衛星影像很容易超過幾百兆、甚至幾個幾千兆位元組，「在本地電腦開發衛星影像，自然會很笨重且耗時。」許多新聞媒體根本沒有這樣的設備。因此，像Picterra這樣的平台，就能提供處理大量資料的協助。

在剔除錯誤的樣本（例如陰影、水體）後，視覺調查團隊最終發現，截至2023年11月17日，在加薩南部有超過200個符合這種炸彈類型的彈坑——這對尋求安全的加薩南部平民構成了普遍威脅，《紐約時報》在其調查報導中指出，「實際使用過的這類炸彈，可能比我們報導中所捕捉到的還要多。」

對於擔心AI取代人類的擔憂，賈維里說明：「我們並不是用AI來取代人類的工作。我們之所以使用AI，是因為這類任務如果手動完成會耗費太多時間，以至於會影響其他調查工作。」正如他所說，AI可以幫助調查記者在大海撈針中的過程中，更快找到那根針。