生成式AI浪潮下 新聞業的機會與挑戰(上)

2024 年 08 月 27 日 | 卓越新聞電子報

donation
陳洧農|特約記者採訪報導

生成式AI在過去一年來對新聞業造成深遠的影響,為探討如何在使用這項技術的同時保有新聞的核心價值——真實與正確,台灣新聞記者協會與台灣新聞攝影協會在政大公企中心合辦「AI對新聞產業的影響」系列論壇。首場討論的主題是「生成式AI在新聞室的應用:實務案例分享與交流」。論壇的上半場,來自《READr+》的記者李又如、《中央社》媒體實驗室主任宋育泰,以及ETtoday專題中心資深記者唐鎮宇,深入探討了AI在新聞業中的應用實例與面臨的挑戰。

分析大量文本的利器

李又如介紹,《READr+》使用生成式AI製作報導的初體驗,是去年的〈一躍成為經濟學人封面:臺灣如何成為外媒焦點〉。這篇報導中,以AI進行「主題分析」和「情緒分析」,大大提升了文本分析的精確度。生成式AI的自然語言理解能力,讓記者能夠直接詢問文本主題,大幅縮短了以往需要斷詞等繁瑣工序的時間。

此外,過往需要耗費大量時間,往往是交由工讀生進行的「資料標記」(Data Labeling),如今也可以由AI處理。「資料標記」簡單說就是依據內容將文本貼上屬性標籤。這麼做有什麼好處呢?李又如說,資料新聞常會做輿論分析,記者在抓取網路上的討論時,可以要求AI篩選有特定標記的內容,確保社會議題的討論不易失焦。

但李又如也提醒,不論是交由AI還是工讀生來做,都必須經過抽查驗證的程序。「不管分析資料的角色是人還是AI ,其實我們並沒有改變做新聞的流程,只是角色換而已。」

李又如表示,有了ChatGPT之後,情緒分析的精確度提升許多。(特約記者陳洧農攝)

李又如表示,有了ChatGPT之後,情緒分析的精確度提升許多。(特約記者陳洧農攝)

從事資料新聞最好的時代

李又如認為,生成式AI帶來最大的改變是賦能。即便資料記者自己就會寫程式語言、做資料分析,但更專業的工序還是需要後端工程師的協助。生成式AI在相當程度上將這些技能的門檻降低,記者因而能夠有更多的調整空間,也大幅降低了探索的成本。

李又如說,做資料新聞的一大門檻是程式語言。以前如果要做較進階的分析,就要上網作功課,現在直接問ChatGPT就好了。「你知道你想要做什麼,可是你不會寫,沒有關係,它直接寫給你。」

那麼,一般記者是不是就能無痛轉換成資料記者呢?不盡然。李又如認為,最難的部分在於從「訪問人」到「訪問資料」的心態轉換;但如今生成式AI幾乎把技術的門檻降到最低,若是有心要學,現在正是進入資料新聞領域最好的時代。

李又如說,這一年來大家對AI浪潮有許多憂慮,但對她來說沒有太多抗拒,使用的經驗和效果都非常好。(特約記者陳洧農攝)

李又如說,這一年來大家對AI浪潮有許多憂慮,但對她來說沒有太多抗拒,使用的經驗和效果都非常好。(特約記者陳洧農攝)

AI使用比重逐年增加

宋育泰表示,若以廣義的AI來說,《中央社》其實很早就開始使用AI協助新聞產製。例如2018年使用模板新聞,讓地震消息自動進稿;2019年與資策會合作開發人臉辨識的AI程式;2020年起,除了利用文字轉語音的方式唸新聞,也開始使用程式斷詞來進行文本解析,到了2022年,此程序已經推及社內所有新聞,成為標準化的作業流程。

宋育泰特別強調,《中央社》和資策會合作開發的人臉辨識系統雖然是使用《中央社》的照片作為資料庫,但都是出現在公共場合的照片,而且是針對名人進行辨識;隨機出現的路人不具可辨識性,也不在使用範圍內,因此即便有侵犯隱私權的疑慮,程度也很低。

及至2023年,各種生成式AI軟體有如雨後春筍般萌生,媒體內部也多方應用,逐字稿、圖像設計、翻譯都不在話下。他說,有些概念複雜的圖像不見得能在素材圖庫中找到,即便有,風格也不一致;而Midjourney可以讓素材風格統一,大幅提升美編的效率。另外,很多時候跟AI互動還能發現預期外的構想和呈現方式。

宋育泰分享了許多編輯端的AI應用。(特約記者陳洧農攝)

宋育泰分享了許多編輯端的AI應用。(特約記者陳洧農攝)

AI在編輯層面的功能漸趨完備

除了上述功能,AI撰寫一周大事、問答機器人等功能也在《中央社》的使用範疇中,今年七月更透過社內主播的聲音訓練出專屬的聲音模型「百聲」,可謂應用多端。儘管如此,宋育泰特別聲明,《中央社》對於生程式AI的使用相當謹慎。

鑒於這項日新月異的新科技可能引發的爭議及疑慮,《中央社》2023年9月1日宣布了「《中央社》生成式AI應用指南」,並隨著時間推進持續編修。例如今年因應「百聲」的上線,就增加了虛擬主播的使用範圍與規範。

宋育泰將《中央社》的對生成式AI的應用描述為「打一套AI的組合拳」,從進稿、編輯一直到發稿的過程中,將AI能發揮功能的環節一個個組合起來。他特別指出,將這些功能完備的用意並不是要把編輯裁員或縮編,而是希望能夠透過AI的服務加速新聞製程、減少錯誤,進而投入更多記者到現場。 

講座相當踴躍,除了從業人員以外,也有不少學者、學生參與。(特約記者陳洧農攝)

講座相當踴躍,除了從業人員以外,也有不少學者、學生參與。(特約記者陳洧農攝)

選美編或選AI?

隨著ChatGPT和MidJourney這類AI工具逐漸進入新聞製程,AI是否會取代記者或美編的話題一直引發熱議。唐鎮宇從自身經歷出發,比較了使用生成式AI以及與人類共事的經驗。

唐鎮宇在製作《台灣長照家庭圖鑑》時正值疫情期間,無法拍攝現場,因此選擇以手繪插圖的方式做視覺呈現。但是關於圖像的風格與方式,卻花費了長達兩個月的時間和美編討論,時間成本相當可觀。但他也表示,美編最後製作出的圖像卻有著令他驚嘆的巧思與細膩。

後來唐鎮宇在使用生成式AI生成圖象時,面臨的困境剛好相反。「沒有人跟我討論到底該畫什麼。」他說,AI確實能生成品質不錯的圖像,但是在風格與細節的把控上,還是難以和人類媲美。而且,圖像風格和細節的調校,其實要比想像更費時。

在AI的使用經驗上,唐鎮宇分享了許多獨特的觀點。(特約記者陳洧農攝)

在AI的使用經驗上,唐鎮宇分享了許多獨特的觀點。(特約記者陳洧農攝)

AI做記者?很難!

談及生成式AI會不會取代記者,唐鎮宇認為現階段還是有相當難度。他詢問現場的新聞同業,與ChatGPT互動的經驗如何。有人認為,除非事前提供有用的資料,否則能難以得到有深度的回答;也有人反應,ChatGPT的資庫無法即時更新,因此對於時事脈動的對應力較差。

唐鎮宇進一步指出,AI在處理某些敏感話題時仍有限制,這些限制可能是基於AI倫理考量;但記者工作往往需要報導一些敏感或爭議性的社會議題,這種能力AI目前仍難以完全取代。

這樣的說法並非沒有道理,畢竟記者工作需要高度的靈活與彈性;但就如同早前ChatGPT被限制不能教導投資理財一樣,對敏感話題的限制,也是人為的枷鎖,是值得注意之處。

唐鎮宇說,自己嘗試使用AI生成擬真風格的圖片時,在內部遭到強烈抵抗。(特約記者陳洧農攝)

唐鎮宇說,自己嘗試使用AI生成擬真風格的圖片時,在內部遭到強烈抵抗。(特約記者陳洧農攝)

提升了效率,衝擊了倫理

唐鎮宇和李又如持類似的看法,認為,ChatGPT這類大型語言模型最大的影響,就是讓記者開始有初階的工程師能力。他說,在地震新聞的發稿中,ETtoday的AI小組團隊成功開發出了一個能夠迅速生成新聞稿的AI模型,並且已經擴展至天氣預報的其他應用場景。

在其他流程中,生成式AI的應用也所在多有,例如改錯字、下標題、併稿、寫訪綱、甚至延伸改寫。但是對於AI能夠讓媒體投入更多記者到現場、或是把更多能量拿來做深度報導的說法,唐鎮宇認為太過理想化,「這完全是勞方的角度,」他笑說:「資方一定不會這麼想。」

唐鎮宇也指出,在生成式AI廣泛應用於新聞製作的同時,倫理問題逐漸浮現。在圖像的使用上,他認為,為降低讀者誤認為真的風險,不應使用擬真圖片。至於文字的部分,他說,雖然「人類要為最後生產結果負責」是現在的共識,但這衍伸出一個問題:標示該怎麼標?

「如果我要負全責,我要標示嗎?」他以AI協作的氣象新聞為例,標示寫著「70%由AI生成,30%由人工校對而成」,那讀者該如何看待這樣的標示?「到底是會下雨的部分還是不會下雨的部分由人工審核?我不知道。」

唐鎮宇強調,媒體的核心在於讀者的信任。無論新聞報導使用了何種技術,最終都應該由媒體對報導的準確性負責,關於使用AI的標示與否、怎麼標、以及標示所代表的意涵,是值得深思的問題。