網路爬蟲 | 卓越新聞獎基金會

新聞出版商因 AI 抓取疑慮　限制網際網路檔案館的存取權

2026年03月18日 | 卓越新聞電子報

非營利數位圖書館「網際網路檔案館（Internet Archive）」以保存網路內容為使命，提供「網站時光機（Wayback Machine）」的公眾數位檔案館服務，同時也使用爬蟲技術捕捉網頁快照（snapshots）。然而，隨著 AI 機器人為了餵養模型而在網路上搜尋訓練素材，網際網路檔案館初始承諾的資訊自由存取權，已成為某些新聞出版商眼中的潛在威脅。

AI科技公司與新聞媒體內容授權交易的利害權衡

2024年09月18日 | 卓越新聞電子報

隨著生成式人工智慧（GenAI）技術的崛起，新聞媒體與AI科技公司之間的授權交易浮上檯面。此類交易協議為媒體公司帶來額外收益和技術創新機會，但同時也面臨著作權保護、新聞價值稀釋等挑戰。下文將先討論《紐約時報》等媒體與AI科技公司之間的授權與法律糾紛，接著探討新聞媒體授權內容給AI科技公司的利益與挑戰。

牛津路透新聞學研究所報告：有多少新聞網站封鎖了 AI 爬蟲？

2024年04月11日 | 卓越新聞電子報

在生成式AI時代，OpenAI的ChatGPT和Google的Gemini（原名Bard）可說是AI聊天機器人龍頭。為了讓AI的回答更加精確，它們需要很多資料訓練其大型語言模型（LLM），各國的新聞網站便是資料來源之一。然而，牛津路透新聞學研究所（Reuters Institute for the Study of Journalism）於2024年2月發佈的一篇研究報告指，在他們研究的10個國家中，有些新聞網站已經封鎖了OpenAI和Google，阻止他們使用AI爬蟲從其網站上抓取資料。

標籤: 網路爬蟲

新聞出版商因 AI 抓取疑慮　限制網際網路檔案館的存取權

AI科技公司與新聞媒體內容授權交易的利害權衡

牛津路透新聞學研究所報告：有多少新聞網站封鎖了 AI 爬蟲？

卓越新聞電子報

為讀者報導新聞媒體最前線，追蹤所有重大新聞演講活動現場、探索新聞媒體浮動的疆界！

標籤: 網路爬蟲

新聞出版商因 AI 抓取疑慮 限制網際網路檔案館的存取權

AI科技公司與新聞媒體內容授權交易的利害權衡

牛津路透新聞學研究所報告：有多少新聞網站封鎖了 AI 爬蟲？

卓越新聞電子報

為讀者報導新聞媒體最前線，追蹤所有重大新聞演講活動現場、探索新聞媒體浮動的疆界！

新聞出版商因 AI 抓取疑慮　限制網際網路檔案館的存取權