Meta訓練其寫作生成式AI也構成合理使用?Kadrey v. Meta Platforms案判決

圖片來源 : shutterstock、達志影像

※如欲轉載本文,請與北美智權報聯絡

楊智傑/雲林科技大學 科技法律研究所 教授

Meta因爲開發其生成式AI(Gen AI) — Llama,而被十三名作家聯名提告侵害其書籍著作權。這件判決系在加州北區地院法官Alsup法官於2025年6月23日對Gen AI合理使用議題做出美國第一起判決後,由同法院的Chhabria法官在二日後,對Gen AI合理使用議題做出的第二起判決。而此次判決認爲,Meta行爲可構成合理使用。但也認爲Gen AI介入造成書籍市場的「市場稀釋」確實是一種對著作權人的傷害。

Meta透過網路下載盜版書籍及納入Llama訓練資料集

Meta於2023年2月推出大型語言模型(LLM) — Llama 1,並於2024年4月推出Llama 3以及整合Llama 3的AI聊天機器人(chatbot)「Meta AI」[1]。

Meta需要書籍作爲Llama的訓練資料,因爲書籍對AI訓練而言是高品質的訓練材料。但Meta意識到取得書籍授權難度超出預期後,開始轉而透過「影子圖書館」(shadow libraries)來取得訓練所需的書籍與其他文本。「影子圖書館」是指可免費下載書籍資料的線上資料庫,其提供內容包括書籍、學術期刊文章、音樂或影片,無論這些資料是否受著作權保護[2]。

Meta將其從「影子圖書館」下載的書籍資料納入用於訓練Llama模型的資料集。Meta也對其模型進行了後訓練,以防止模型「記住」並輸出其訓練資料中的某些文字,包括受著作權保護的內容。Meta的專家證人使用一種設計誘使LLM吐出訓練資料內容的「對抗性」提示法進行測試,也無法讓任何AI模型產出超過50個字詞與標點符號(tokens)來自原告書籍的內容[3]。

原告爲十三名作家

原告共十三位作家,他們的作品包括劇本、短篇故事、回憶錄、散文及非小說類書籍。原告等人擁有著作權的所有書籍皆可在Meta用於訓練AI的資料集中找到。在這些資料集中,Meta共下載了至少666本原告擁有著作權的書籍副本[4]。每位原告皆表示,他們願意授權其書籍給Meta作爲Gen AI訓練資料之用,但Meta從未與他們洽談過任何授權事宜[5]。

原告在加州北區地院提起本訴訟,主張Meta爲訓練AI複製其書籍的行爲,直接造成著作權侵害。另主張用bit技術下載時,同時分享給他人下載,亦構成侵權[6]。而被告Meta請求法院對直接侵權與合理使用爭議作出即決判決[7]。

合理使用分析

本案是在加州北區地院William Alsup法官於2025年6月23日對Gen AI「合理使用」議題做出美國第一起判決後[8],由同法院的Vince Chhabria法官在二日後,對Gen AI合理使用議題做出的第二起判決,以下介紹本案的合理使用四因素分析。

Chhabria法官認爲,Meta對原告書籍的使用具有高度轉化性。Meta複製書籍的目的在於訓練其LLMs,這些模型是創新的工具,可用於產生多樣化的文本並執行各種功能。使用者可以請Llama 編輯他們撰寫的電子郵件、翻譯某段文字或將其翻譯成外語、根據假設情境編寫一段短劇,或執行其他多種任務[9]。

Llama的目的並非要取代原著作或對原著作「重新包裝」。法官認爲,即使使用「對抗性」提示方式讓Llama反芻其訓練資料,Llama也不會提供超過原書籍內50個單詞。而且沒有跡象表明它會生成爲更長的文本內容來作爲這些書籍的「重新包裝」。這些證據最多表明Meta希望Llama能夠生成某些風格的文本。但因風格不受版權保護 — 只有表達才受版權保護[10]。

合理使用第二因素中,若是創意性高或具高度表現性之著作,不利於主張合理使用。而Meta之所以要選用書本作爲訓練資料,就是因爲書本的寫作文字風格連貫,文法正確,屬高品質的訓練資料[11]。故此因素不利於主張合理使用。

法官認爲,第三因素對Meta有利,即使Meta完全複製了原告的書籍。考慮到Meta訓練AI的轉化性目的,Meta複製的數量是合理的。如果LLM接受更高品質材料的訓練,確實效果更好。因此法官出於訓練AI的轉化性目的認爲,將完整書籍提供給LLM訓練會比只提供半本書給LLM訓練相比,能達到更好的效果,因而認爲Meta「利用整本作品」是「合理必要的」[12]。

即使使用具高度轉化性,仍然會因爲此類使用對原始作品市場的影響過大而不構成合理使用。在涉及將受著作權保護的作品用於訓練Gen AI模型的案件中,原告至少主張其受到三種損害[13]:

直接生成原告書籍內容?

第一種損害主張是,透過Llama生成內容直接影響書籍銷售。但法官認爲,在本案中,這種損害理論並不成立,因爲如上所述,Llama無法讓使用者生成原告書籍中任何具意義的內容[14]。

損害原告在授權AI訓練方面可獲得之授權金?

原告主張,Meta未經授權使用他們的書籍進行LLM訓練,損害了爲訓練AI授權書籍的市場。雙方就是否存在或可能發展的一般書籍授權市場進行詳細討論。但法官認爲,這樣的市場是否存在或可能發展並不重要,因爲在主張轉化性利用時,原告根本不能主張就這個轉化性目的而認定「未收到費用」是一種損害,否則就根本無法主張轉化性利用了[15]。

產生市場稀釋或間接替代?

原告的第三種主張是,使用受著作權保護的書籍來訓練LLM可能會快速生成無數與原作競爭的作品。這種損害或許可稱爲「間接」替代效果,非「直接」替代效果。又或者可稱爲「市場稀釋」[16]。

法官認爲,「市場稀釋」的現象確實已經發生。許多人利用AI協助寫作,加快了書籍的出版[17]。這些產出將減少作者的銷售,進而影響作者創作的動力,而這是《著作權法》需要防止的傷害[18]。

不過,原告對於這個論點並沒有提供充足的證據。故就這一點上只能判決原告敗訴[19]。但這並不表示在其他Gen AI的爭議中不能主張「市場稀釋」損害。

不承認合理使用就會阻礙AI發展?

Meta主張,認爲不承認合理使用就會阻礙AI的發展。法官表示,雖然以此案認爲AI訓練可構成合理使用,但並不同意Meta上述的說法。其認爲,就算不承認合理使用,Meta仍可透過支付授權金取得授權的方式得到作者同意才進行AI訓練[20]。

結語

Chhabria法官最後綜合合理使用判斷四因素後,認爲Meta爲訓練其Gen AI的行爲複製原告等人之著作構成合理使用。但值得注意的有二點:(1)「市場稀釋」是一個重要議題,只是本案的十三名原告沒有充分舉證。但未來不排除在其他合理使用爭議中,充分舉證產生「市場稀釋」效果而認爲不構成合理使用;(2)法官雖承認可構成合理使用,但並不認爲「發展訓練AI之著作授權市場」是完全不可能的。

延伸閱讀:

備註:

責任編輯:盧頎

【本文僅反映專家作者意見,不代表本報立場。】

真理大學法律系副教授

中央大學產業經濟所碩士

臺灣大學法學博士

延伸閱讀&電子報訂閱連結:

【詳細內容請見《北美智權報》385期;歡迎加入NAIPNews網站會員成爲我們的訂戶,以掌握最關鍵的專利商標智財消息!】