法律資料涉及AI訓練資料庫之首件著作權侵權判決出爐:淺析Thomson Reuters v. Ross一案

圖片來源 : shutterstock、達志影像

許慈真/北美智權報 專欄作家

針對法律資料庫巨擘THOMSON REUTERS與競爭對手ROSS INTELLIGENCE自2020年掀起之侵權爭議,德拉瓦州聯邦地院終於定調,ROSS構成著作權侵害且不符合理使用。

本案[1]原告Thomson Reuters擁有知名法律研究平臺Westlaw,爲使用者提供判例法、州及聯邦法規、期刊論文、專論等法律資料。Thomson Reuters指控Ross Intelligence抄襲Westlaw資料庫提供之裁判要點(headnotes),Ross則質疑該資料庫中之要點及其法律分類系統「Key Number System」是否受法律保護,並主張合理使用。負責審理本案之Bibas法官曾於2023年裁決意見[2]中駁回兩造簡易判決之動議,卻在即將展開庭審之際,邀請兩造更新動議,並就涉訟要點中之2,243項(後稱係爭要點)認定構成侵權,同時駁回Ross合理使用之主張。惟Bibas法官亦指出,係爭要點中之個別著作權保護期間是否屆滿,屬於事實問題,應交由陪審團決定。

爲了解第三方法律服務供應商LegalEase爲Ross製作之Bulk Memo問答集,其中問題是否抄襲係爭要點,或僅是擷取自不受著作權保護之裁判意見?Bibas法官利用既有判決[3]作成以下之對照範例(非本案涉訟之資料),據此說明其裁決理由,分述如後。

資料來源:引自本案判決Thomson Reuters Enter. Ctr. GmbH v. Ross Intel. Inc., Case No. 1:20-cv-613-SB (11 Feb 2025)

法院認定Ross構成直接侵權

係爭要點與Key Number System皆具原創性

於2023年意見中,Bibas法官曾以「要點與裁判意見間之字詞重疊程度」作爲有無原創性(originality)之決定性因素,惟如今改認爲,原創性門檻極低,僅需些許創造性火花即已足。Bibas法官表示,儘管裁判意見不受著作權保護,但編纂者透過精煉、綜合或解釋等方式,將冗長之裁判意見濃縮成簡短要點,系運用最低程度之創造力選擇及安排字詞而成,自然具備原創性,屬於事實性編輯著作,無論是「整體」或「個別」要點均受著作權保護。

同理,即使是逐字逐句引述部分裁判意見之要點(quote judicial opinions verbatim),亦是編纂者精心挑選之結果,其透過確定關鍵字詞、剔除雜亂內容等步驟,表達出其所認定之裁判重點。不過,Bibas法官補充道,這並不包括與裁判意見一字不差的要點(verbatim copies of the case opinion)。其次,著作是否受保護之關鍵在於有無原創性,與著作人投入努力多寡無關;且編輯著作不必「新穎」,只要是「著作人獨立創作」即可滿足原創性要件。因此,既然Key Number System是Thomson Reuters在衆多可行且合乎邏輯之法律主題分層架構法中所選定之方法,縱使該分類方法是法學院新生普遍知悉,亦不影響其原創性。

Ross實際抄襲係爭要點

證明實際抄襲(actual copying)之方式有二:一是直接證據;二是間接證據,證明被告曾接觸(access)原告著作並創作出類似作品,亦即存在近似性(probative similarity)。

兩造均同意,LegalEase確實取用Westlaw資料並以此製作Bulk Memo問答集,然而,僅是「接觸」不足以證明抄襲。Bibas法官逐一比對觀察Bulk Memo問題、係爭摘要以及裁判意見後,亦證實Bulk Memo問題與係爭摘要之近似程度高於其與裁判意見之近似程度,這已成爲證明實際抄襲之有力旁證(circumstantial evidence) — 近似性加上接觸,即構成實際抄襲之證據。況且,如Ross法律顧問所言,Ross將Bulk Memo問題之80%用於初始訓練(initial training),20%用於驗證(validation),可說是將該問答集全數作爲訓練AI之用。

Ross抄襲屬於不當挪用

倘若被告作品大致上(materially)挪用自原著作,即具備實質近似性(substantial similarity)[4]而構成不當挪用(improper appropriation)。實質近似性之判斷,系從產品之一般使用者(ordinary user)角度觀察,視被告作品是否與原著作實質近似而定;而所需之近似程度,則視著作之可受保護表達之範圍寬窄而定,如範圍越窄,涉嫌侵權之作品就必須與該著作越相似。因而,Bibas法官以自身立場爲判斷(律師與法官皆是Westlaw平臺之一般使用者),認定Bulk Memo問題與係爭要點明顯近似。

法院認定Ross不構成合理使用

利用之目的與特性

Ross之利用顯然屬於商業性,且該利用之目的或特性與Westlaw平臺並無太大不同,故不具備轉化性(transformative)。Bibas法官特別指出,Ross並非採用可自行編纂新內容之生成式AI(Gen AI),而是利用係爭要點訓練AI,當使用者輸入法律問題時,會傳回事先備妥之相關裁判意見;此流程類似於Westlaw利用要點與Key Numbers來傳回符合要點之案件清單,而Thomson Reuters正是利用要點與Key Number System,協助法律研究人員瀏覽平臺。

惟Ross對此抗辯,係爭要點並未出現在使用者接觸之最終產品中,其複製行爲系發生在中間步驟(intermediate step),亦即,Ross將係爭要點轉換成描述法律詞彙彼此關係之數值型資料(numerical data)餵養給AI。就合理使用之第一項因素而言,在分析電腦程式之案件中,確實亦允許中間複製,例如Google案[5]、Sony案[6]、Sega案[7]等皆是。

然而,本案看似與該等案件類似,實則不同。其差異點在於:(1)該等案件皆涉及電腦程式碼之複製,程式碼幾乎純屬功能性目的,與本案複製之要點等書面文字不同;(2)該等案件之複製系基於「抄襲對競爭對手創新而言乃是不可或缺」此一前提,惟本案欠缺此必要性。

Bibas法官表示,Ross之所以利用係爭要點,僅是爲輕鬆開發出有競爭力之法律研究工具而已,此情況反倒較接近Warhol案[8]所分析:抄襲並非達成新利用目的之合理必要手段。因此,本項因素判斷繫有利於Thomson Reuters。

著作之本質

原則上,越具創意性之著作保護範圍越廣。儘管係爭要點符合原創性門檻,惟創意程度有限,故本項因素判斷繫有利於Ross。

所利用之質量及其佔整體著作之比例

在本案,本項因素之判斷關鍵在於「公衆接觸之質與量」(指是否成爲競爭性替代商品),而非「被告抄襲之質與量」,鑑於Ross向使用者提供之內容並未包含係爭要點,故本項因素判斷繫有利於Ross。

利用對於著作其潛在市場與現在價值之影響

原著作之市場爲「法律研究平臺」,以及著作人通常自行或授權他人開發之潛在衍生性市場,「法律AI工具之訓練資料」即是其一;於此前提下,Ross確實可能開發市場替代品以與Westlaw競爭,而非建立用途完全不同之新平臺。況且,Ross並未舉證反駁此等潛在市場不存在、或不受影響,故本項因素判斷繫有利於Thomson Reuters。

Bibas法官特別指出,本案情況與Google案不同,Sun Java API乃是程式設計師所熟悉慣用,Thomson Reuters所創作之要點或法律分類系統並無此特性,Ross大可自行創作或委託LegalEase爲其創作,並無侵害Thomson Reuters著作權並主張合理使用之必要。

結語

儘管本案只是美國聯邦地院層級之司法裁判,且未涉及目前最熱門之Gen AI,但其後續審理結果以及法院見解之擴散效應,相當值得關注;更遑論,Bibas法官本身即爲聯邦第三巡迴上訴法院之巡迴法官,其對於「中間複製」與「原著作潛在市場」之解釋及認定,確實可能影響Gen AI開發者主張合理使用之空間。上述案件分析亦可提供臺灣政府針對各種資料庫進行AI訓練、Gen AI的運用相關立法參酌。

備註:

責任編輯:盧頎

【本文僅反映專家作者意見,不代表本報立場。】

輔仁大學財經法律翻譯碩士學程

輔仁大學財經法律學系碩士

輔仁大學法律學系學士

延伸閱讀&電子報訂閱連結:

【詳細內容請見《北美智權報》376期;歡迎加入NAIPNews網站會員,或以系統訂閱《北美智權報》】

※如欲轉載本文,請與北美智權報聯絡