☰

Meta訓練其寫作生成式AI也構成合理使用？Kadrey v. Meta Platforms案判決

圖片來源 : shutterstock、達志影像

※如欲轉載本文，請與北美智權報聯絡

楊智傑／雲林科技大學科技法律研究所教授

Meta因爲開發其生成式AI（Gen AI） — Llama，而被十三名作家聯名提告侵害其書籍著作權。這件判決系在加州北區地院法官Alsup法官於2025年6月23日對Gen AI合理使用議題做出美國第一起判決後，由同法院的Chhabria法官在二日後，對Gen AI合理使用議題做出的第二起判決。而此次判決認爲，Meta行爲可構成合理使用。但也認爲Gen AI介入造成書籍市場的「市場稀釋」確實是一種對著作權人的傷害。

Meta透過網路下載盜版書籍及納入Llama訓練資料集

Meta於2023年2月推出大型語言模型（LLM） — Llama 1，並於2024年4月推出Llama 3以及整合Llama 3的AI聊天機器人（chatbot）「Meta AI」[1]。

Meta需要書籍作爲Llama的訓練資料，因爲書籍對AI訓練而言是高品質的訓練材料。但Meta意識到取得書籍授權難度超出預期後，開始轉而透過「影子圖書館」（shadow libraries）來取得訓練所需的書籍與其他文本。「影子圖書館」是指可免費下載書籍資料的線上資料庫，其提供內容包括書籍、學術期刊文章、音樂或影片，無論這些資料是否受著作權保護[2]。

Meta將其從「影子圖書館」下載的書籍資料納入用於訓練Llama模型的資料集。Meta也對其模型進行了後訓練，以防止模型「記住」並輸出其訓練資料中的某些文字，包括受著作權保護的內容。Meta的專家證人使用一種設計誘使LLM吐出訓練資料內容的「對抗性」提示法進行測試，也無法讓任何AI模型產出超過50個字詞與標點符號（tokens）來自原告書籍的內容[3]。

原告爲十三名作家

原告共十三位作家，他們的作品包括劇本、短篇故事、回憶錄、散文及非小說類書籍。原告等人擁有著作權的所有書籍皆可在Meta用於訓練AI的資料集中找到。在這些資料集中，Meta共下載了至少666本原告擁有著作權的書籍副本[4]。每位原告皆表示，他們願意授權其書籍給Meta作爲Gen AI訓練資料之用，但Meta從未與他們洽談過任何授權事宜[5]。

原告在加州北區地院提起本訴訟，主張Meta爲訓練AI複製其書籍的行爲，直接造成著作權侵害。另主張用bit技術下載時，同時分享給他人下載，亦構成侵權[6]。而被告Meta請求法院對直接侵權與合理使用爭議作出即決判決[7]。

合理使用分析

本案是在加州北區地院William Alsup法官於2025年6月23日對Gen AI「合理使用」議題做出美國第一起判決後[8]，由同法院的Vince Chhabria法官在二日後，對Gen AI合理使用議題做出的第二起判決，以下介紹本案的合理使用四因素分析。

Chhabria法官認爲，Meta對原告書籍的使用具有高度轉化性。Meta複製書籍的目的在於訓練其LLMs，這些模型是創新的工具，可用於產生多樣化的文本並執行各種功能。使用者可以請Llama 編輯他們撰寫的電子郵件、翻譯某段文字或將其翻譯成外語、根據假設情境編寫一段短劇，或執行其他多種任務[9]。

Llama的目的並非要取代原著作或對原著作「重新包裝」。法官認爲，即使使用「對抗性」提示方式讓Llama反芻其訓練資料，Llama也不會提供超過原書籍內50個單詞。而且沒有跡象表明它會生成爲更長的文本內容來作爲這些書籍的「重新包裝」。這些證據最多表明Meta希望Llama能夠生成某些風格的文本。但因風格不受版權保護 — 只有表達才受版權保護[10]。

合理使用第二因素中，若是創意性高或具高度表現性之著作，不利於主張合理使用。而Meta之所以要選用書本作爲訓練資料，就是因爲書本的寫作文字風格連貫，文法正確，屬高品質的訓練資料[11]。故此因素不利於主張合理使用。

法官認爲，第三因素對Meta有利，即使Meta完全複製了原告的書籍。考慮到Meta訓練AI的轉化性目的，Meta複製的數量是合理的。如果LLM接受更高品質材料的訓練，確實效果更好。因此法官出於訓練AI的轉化性目的認爲，將完整書籍提供給LLM訓練會比只提供半本書給LLM訓練相比，能達到更好的效果，因而認爲Meta「利用整本作品」是「合理必要的」[12]。

即使使用具高度轉化性，仍然會因爲此類使用對原始作品市場的影響過大而不構成合理使用。在涉及將受著作權保護的作品用於訓練Gen AI模型的案件中，原告至少主張其受到三種損害[13]：

直接生成原告書籍內容？

第一種損害主張是，透過Llama生成內容直接影響書籍銷售。但法官認爲，在本案中，這種損害理論並不成立，因爲如上所述，Llama無法讓使用者生成原告書籍中任何具意義的內容[14]。

損害原告在授權AI訓練方面可獲得之授權金？

原告主張，Meta未經授權使用他們的書籍進行LLM訓練，損害了爲訓練AI授權書籍的市場。雙方就是否存在或可能發展的一般書籍授權市場進行詳細討論。但法官認爲，這樣的市場是否存在或可能發展並不重要，因爲在主張轉化性利用時，原告根本不能主張就這個轉化性目的而認定「未收到費用」是一種損害，否則就根本無法主張轉化性利用了[15]。

產生市場稀釋或間接替代？

原告的第三種主張是，使用受著作權保護的書籍來訓練LLM可能會快速生成無數與原作競爭的作品。這種損害或許可稱爲「間接」替代效果，非「直接」替代效果。又或者可稱爲「市場稀釋」[16]。

法官認爲，「市場稀釋」的現象確實已經發生。許多人利用AI協助寫作，加快了書籍的出版[17]。這些產出將減少作者的銷售，進而影響作者創作的動力，而這是《著作權法》需要防止的傷害[18]。

不過，原告對於這個論點並沒有提供充足的證據。故就這一點上只能判決原告敗訴[19]。但這並不表示在其他Gen AI的爭議中不能主張「市場稀釋」損害。

不承認合理使用就會阻礙AI發展？

Meta主張，認爲不承認合理使用就會阻礙AI的發展。法官表示，雖然以此案認爲AI訓練可構成合理使用，但並不同意Meta上述的說法。其認爲，就算不承認合理使用，Meta仍可透過支付授權金取得授權的方式得到作者同意才進行AI訓練[20]。

結語

Chhabria法官最後綜合合理使用判斷四因素後，認爲Meta爲訓練其Gen AI的行爲複製原告等人之著作構成合理使用。但值得注意的有二點：（1）「市場稀釋」是一個重要議題，只是本案的十三名原告沒有充分舉證。但未來不排除在其他合理使用爭議中，充分舉證產生「市場稀釋」效果而認爲不構成合理使用；（2）法官雖承認可構成合理使用，但並不認爲「發展訓練AI之著作授權市場」是完全不可能的。

Meta訓練其寫作生成式AI也構成合理使用？Kadrey v. Meta Platforms案判決

相關資訊