《紐約時報》更新服務條款,禁止使用新聞報導內容來開發人工智慧模型
根據Adweek的報導,8月3日,《紐約時報》更新了其服務條款,明確禁止使用其內容(包括文本、圖片、音頻/視頻剪輯、元數據等)來開發任何軟件程序,包括但不限於機器學習和人工智能系統。同時,新的條款還規定,未經出版社書面許可,不得使用自動化工具如網站爬蟲等來訪問或收集相關內容,違反者可能面臨未具體說明的罰款或處罰。

根據Adweek的報導,8月3日,《紐約時報》更新了其服務條款,明確禁止使用其內容(包括文本、圖片、音頻/視頻剪輯、元數據等)來開發任何軟件程序,包括但不限於機器學習和人工智能系統。同時,新的條款還規定,未經出版社書面許可,不得使用自動化工具如網站爬蟲等來訪問或收集相關內容,違反者可能面臨未具體說明的罰款或處罰。
值得注意的是,儘管紐約時報引入了這些新限制,但該出版社似乎並未對其robots.txt進行任何更改,該文件通知搜索引擎爬蟲可以訪問哪些URL。這可能是對Google隱私政策最近更新的一種回應,該政策顯示Google可能會從網絡上收集公共數據來訓練其各種人工智慧服務。
許多流行的人工智慧模型,包括OpenAI的ChatGPT,都是通過訓練大量數據集來進行的,而這些數據集可能包含了從網絡上抓取的受版權保護或以其他方式保護的資料。
此外,《紐約時報》在今年2月還與Google簽署了一項價值1億美元的協議,允許Google在未來三年內能在部分平台上展示《紐約時報》的內容。這可能意味著,該出版社的服務條款變更可能是針對OpenAI、微軟等公司的。
OpenAI 最近宣布,網站營運者現在可以阻止 GPTBot 網絡爬蟲抓取其網站。微軟還在自己的條款和條件中禁止人們使用其人工智慧產品“創建、訓練或改進(直接或間接)任何其他人工智慧服務”,同時禁止用戶從其人工智慧工具中抓取或以其他方式提取數據。包括美聯社和歐洲出版商委員會在內的多家新聞機構簽署了一封公開信,呼籲全球立法者制定規則,要求訓練人工智慧數據透明,並在使用數據進行訓練之前徵得所有權人的同意。