新聞出版商因 AI 抓取疑慮 限制網際網路檔案館的存取權
非營利數位圖書館「網際網路檔案館(Internet Archive)」以保存網路內容為使命,提供「網站時光機(Wayback Machine)」的公眾數位檔案館服務,同時也使用爬蟲技術捕捉網頁快照(snapshots)。然而,隨著 AI 機器人為了餵養模型而在網路上搜尋訓練素材,網際網路檔案館初始承諾的資訊自由存取權,已成為某些新聞出版商眼中的潛在威脅。
Read More2026年03月18日 | 卓越新聞電子報
非營利數位圖書館「網際網路檔案館(Internet Archive)」以保存網路內容為使命,提供「網站時光機(Wayback Machine)」的公眾數位檔案館服務,同時也使用爬蟲技術捕捉網頁快照(snapshots)。然而,隨著 AI 機器人為了餵養模型而在網路上搜尋訓練素材,網際網路檔案館初始承諾的資訊自由存取權,已成為某些新聞出版商眼中的潛在威脅。
Read More2024年09月18日 | 卓越新聞電子報
隨著生成式人工智慧(GenAI)技術的崛起,新聞媒體與AI科技公司之間的授權交易浮上檯面。此類交易協議為媒體公司帶來額外收益和技術創新機會,但同時也面臨著作權保護、新聞價值稀釋等挑戰。下文將先討論《紐約時報》等媒體與AI科技公司之間的授權與法律糾紛,接著探討新聞媒體授權內容給AI科技公司的利益與挑戰。
Read More2024年04月11日 | 卓越新聞電子報
在生成式AI時代,OpenAI的ChatGPT和Google的Gemini(原名Bard)可說是AI聊天機器人龍頭。為了讓AI的回答更加精確,它們需要很多資料訓練其大型語言模型(LLM),各國的新聞網站便是資料來源之一。然而,牛津路透新聞學研究所(Reuters Institute for the Study of Journalism)於2024年2月發佈的一篇研究報告指,在他們研究的10個國家中,有些新聞網站已經封鎖了OpenAI和Google,阻止他們使用AI爬蟲從其網站上抓取資料。
Read More