《日經》用自家資料訓練AI聊天機器人 強調正確資訊與版權保護

2025 年 07 月 9 日 | 卓越新聞電子報

特約記者林佳玟編譯報導

日本金融媒體《日經新聞》(Nikkei)因應AI趨勢,建立獨立的AI聊天機器人「Ask! NIKKEI」,提供訂閱者更多元的體驗,並協助釐清複雜的金融議題。「Ask! NIKKEI」目前僅限於《日經》的訂閱者使用,其使用介面嵌入在文章中,結合生成式AI技術,提供個人化的問答服務。採用的資料庫則涵蓋了2020年之後自製的內容,並且會優先使用過去18個月內的內容。

打造AI聊天機器人 為訂戶梳理金融議題

「Ask! NIKKEI」的使用方式與當前流行的大型語言模型(LLMs),如ChatGPT或Google Gemini相似,使用者可以向聊天機器人提出任何問題,只要《日經》的資料庫中有相關答案,它便能回應。此外,《日經》發現許多使用者難以從文章中主動想到要問的問題,因此「Ask! NIKKEI」也加入了「提問建議」的功能。

《日經》之所以必須建立自己的模型來檢索資料庫中的文章,是因為日語領域相對於英語市場,目前仍缺乏大量且高品質的模型,因此外部大型語言模型仍無法有效處理日文內容。《日經》的工程經理Yosuke Suzuki表示,核心工程師曾開發了三到四次的新模型,「報廢並重建 (scrap and build) 了好幾次」,過程並不輕鬆。

除了建立自己的模型外,《日經》還結合自家模型的技術與外部大型語言模型生成的摘要,並根據成本、速度和品質等因素,在不同的外部大型語言模型之間進行切換。當使用者提問時,系統會將多篇文章組合成一個提示(prompt),並明確要求大型語言模型不使用外部資訊來生成答案。

《日經》強調,其最新的新聞和專欄,以及廣泛且即時的商業新聞和突發商業新聞報導,不僅與其他科技平台做出差異化,更是其產品的重要特點,也因此內容版權保護是日經新聞開發此系統時非常重要的一個考量,並進一步開發了自己的機器學習模型來檢查內容是否為日經所有。

而為了避免版權爭議,《日經》的法務部門也決定,對於版權由日經與受訪者各佔一半的採訪文章,這些內容已從「Ask! NIKKEI」的檢索增強生成系統(Retrieval Augmented Generation,簡稱「RAG」)中移除。檢索增強生成系統是一種AI框架,能夠從外部知識庫中檢索事實,以確保大型語言模型提供更準確、更新的資訊,同時讓使用者了解大型語言模型的生成過程。

「Ask! NIKKEI」計劃在行動裝置上啟用 強化訂戶體驗

目前,僅可以在網頁平台上使用「Ask! NIKKEI」,然而大多數《日經》的使用者習慣透過行動裝置存取內容。因此為了提升使用者體驗,《日經》計劃在未來二至三個月內,在其自家的行動應用程式中推出此版本的系統,以提升訂閱者體驗並吸引新用戶。

聊天機器人被視為吸引新訂戶和留住現有訂戶的重要工具。對於不熟悉金融術語的新訂戶來說,他們可以選擇提問或點擊預設好的問題來快速理解內容。即使是《日經》工作了24年的資深員工,也會利用該聊天機器人快速查詢不熟悉的專業金融術語,並獲得高品質的摘要。

而依照《日經》官網對於此工具的說明,「Ask! NIKKEI」除了生成文字之外,還會搭配照片和圖表補充回應,並顯示參考文章的出處,讓訂戶無需花太多時間就能明確得知聊天機器人引用的參考資料。

此外,生成式AI在無法得知查詢答案時,可能會出現編造錯誤資訊的「幻覺」現象,也是AI愛好者很在意的一個問題。對此,Yosuke Suzuki則表示,「Ask! NIKKEI」是根據《日經》發佈的內容進行訓練,因此當使用者所提出的問題,聊天機器人在檢索過程中無法找到相關的文章或資料,系統將不提供答案,避免誤導使用者或產生錯誤資訊,以維持用戶對於聊天機器人的信任度。

《POLITICO》推出AI政策情報助理 協助訂戶生成政策報告

除了日經新聞外,《POLITICO》作為一家全球性的政治、政策權威媒體,從去年開始,在重大政治事件期間,例如民主黨全國代表大會及美國副總統辯論,推出由人工智慧生成的即時新聞摘要,並於今年三月初推出AI「政策情報助理」(Policy Intelligence Assistant)。

「AI驅動政策報告生成器」(AI-Enabled Policy Report Builder)是「政策情報助理」的一個獨特功能,與Capitol AI共同開發。這項新工具讓「POLITICO Pro」的訂閱者能夠即時生成動態的客製化政策報告,不僅可節省數小時的研究與分析時間,還能在數秒內提供具體的行動情報。

Capitol AI執行長Shaun Modi指出,「政策情報助理」將提供量身訂做的洞察,包括協助組織理解美國衛生與公共服務部(United States Department of Health and Human Services,HHS)不斷演變的政策如何影響其供應鏈,或是新興外交政策可能如何左右既有的國防合約,此外,也能協助社區服務提供者釐清,可能需如何應對國家層級資金優先順序的轉變。

但根據科技媒體《Weird》的報導,《POLITICO》的工會「PEN Guild」成員表示,儘管《POLITICO》的記者早在2022年即率先披露美國最高法院已投票推翻《羅訴韋德案》,該公司於今年三月透過其「政策情報助理」工具所生成的一份有關墮胎權的報告,卻仍以憲法保障墮胎權為前提撰寫,錯誤資訊的產製也顯示AI工具的侷限。

 

參考資料

  1. Reuters Institute for the Study of Journalism – 〈What Nikkei learnt from building its own Japanese AI chatbot
  2. 日本經濟新聞 – 〈日本經濟新聞 Ask! NIKKEI
  3. POLITICO – 〈POLITICO Unveils Policy Intelligence Assistant: An AI Powered Suite for Policy Professionals
  4. WIRED – 〈Politico’s Newsroom Is Starting a Legal Battle With Management Over AI