☰

法律資料涉及AI訓練資料庫之首件著作權侵權判決出爐：淺析Thomson Reuters v. Ross一案

圖片來源 : shutterstock、達志影像

許慈真／北美智權報　專欄作家

針對法律資料庫巨擘THOMSON REUTERS與競爭對手ROSS INTELLIGENCE自2020年掀起之侵權爭議，德拉瓦州聯邦地院終於定調，ROSS構成著作權侵害且不符合理使用。

本案[1]原告Thomson Reuters擁有知名法律研究平臺Westlaw，爲使用者提供判例法、州及聯邦法規、期刊論文、專論等法律資料。Thomson Reuters指控Ross Intelligence抄襲Westlaw資料庫提供之裁判要點（headnotes），Ross則質疑該資料庫中之要點及其法律分類系統「Key Number System」是否受法律保護，並主張合理使用。負責審理本案之Bibas法官曾於2023年裁決意見[2]中駁回兩造簡易判決之動議，卻在即將展開庭審之際，邀請兩造更新動議，並就涉訟要點中之2,243項（後稱係爭要點）認定構成侵權，同時駁回Ross合理使用之主張。惟Bibas法官亦指出，係爭要點中之個別著作權保護期間是否屆滿，屬於事實問題，應交由陪審團決定。

爲了解第三方法律服務供應商LegalEase爲Ross製作之Bulk Memo問答集，其中問題是否抄襲係爭要點，或僅是擷取自不受著作權保護之裁判意見？Bibas法官利用既有判決[3]作成以下之對照範例（非本案涉訟之資料），據此說明其裁決理由，分述如後。

資料來源：引自本案判決Thomson Reuters Enter. Ctr. GmbH v. Ross Intel. Inc., Case No. 1:20-cv-613-SB (11 Feb 2025)

法院認定Ross構成直接侵權

係爭要點與Key Number System皆具原創性

於2023年意見中，Bibas法官曾以「要點與裁判意見間之字詞重疊程度」作爲有無原創性（originality）之決定性因素，惟如今改認爲，原創性門檻極低，僅需些許創造性火花即已足。Bibas法官表示，儘管裁判意見不受著作權保護，但編纂者透過精煉、綜合或解釋等方式，將冗長之裁判意見濃縮成簡短要點，系運用最低程度之創造力選擇及安排字詞而成，自然具備原創性，屬於事實性編輯著作，無論是「整體」或「個別」要點均受著作權保護。

同理，即使是逐字逐句引述部分裁判意見之要點（quote judicial opinions verbatim），亦是編纂者精心挑選之結果，其透過確定關鍵字詞、剔除雜亂內容等步驟，表達出其所認定之裁判重點。不過，Bibas法官補充道，這並不包括與裁判意見一字不差的要點（verbatim copies of the case opinion）。其次，著作是否受保護之關鍵在於有無原創性，與著作人投入努力多寡無關；且編輯著作不必「新穎」，只要是「著作人獨立創作」即可滿足原創性要件。因此，既然Key Number System是Thomson Reuters在衆多可行且合乎邏輯之法律主題分層架構法中所選定之方法，縱使該分類方法是法學院新生普遍知悉，亦不影響其原創性。

Ross實際抄襲係爭要點

證明實際抄襲（actual copying）之方式有二：一是直接證據；二是間接證據，證明被告曾接觸（access）原告著作並創作出類似作品，亦即存在近似性（probative similarity）。

兩造均同意，LegalEase確實取用Westlaw資料並以此製作Bulk Memo問答集，然而，僅是「接觸」不足以證明抄襲。Bibas法官逐一比對觀察Bulk Memo問題、係爭摘要以及裁判意見後，亦證實Bulk Memo問題與係爭摘要之近似程度高於其與裁判意見之近似程度，這已成爲證明實際抄襲之有力旁證（circumstantial evidence） — 近似性加上接觸，即構成實際抄襲之證據。況且，如Ross法律顧問所言，Ross將Bulk Memo問題之80%用於初始訓練（initial training），20%用於驗證（validation），可說是將該問答集全數作爲訓練AI之用。

Ross抄襲屬於不當挪用

倘若被告作品大致上（materially）挪用自原著作，即具備實質近似性（substantial similarity）[4]而構成不當挪用（improper appropriation）。實質近似性之判斷，系從產品之一般使用者（ordinary user）角度觀察，視被告作品是否與原著作實質近似而定；而所需之近似程度，則視著作之可受保護表達之範圍寬窄而定，如範圍越窄，涉嫌侵權之作品就必須與該著作越相似。因而，Bibas法官以自身立場爲判斷（律師與法官皆是Westlaw平臺之一般使用者），認定Bulk Memo問題與係爭要點明顯近似。

法院認定Ross不構成合理使用

利用之目的與特性

Ross之利用顯然屬於商業性，且該利用之目的或特性與Westlaw平臺並無太大不同，故不具備轉化性（transformative）。Bibas法官特別指出，Ross並非採用可自行編纂新內容之生成式AI（Gen AI），而是利用係爭要點訓練AI，當使用者輸入法律問題時，會傳回事先備妥之相關裁判意見；此流程類似於Westlaw利用要點與Key Numbers來傳回符合要點之案件清單，而Thomson Reuters正是利用要點與Key Number System，協助法律研究人員瀏覽平臺。

惟Ross對此抗辯，係爭要點並未出現在使用者接觸之最終產品中，其複製行爲系發生在中間步驟（intermediate step），亦即，Ross將係爭要點轉換成描述法律詞彙彼此關係之數值型資料（numerical data）餵養給AI。就合理使用之第一項因素而言，在分析電腦程式之案件中，確實亦允許中間複製，例如Google案[5]、Sony案[6]、Sega案[7]等皆是。

然而，本案看似與該等案件類似，實則不同。其差異點在於：（1）該等案件皆涉及電腦程式碼之複製，程式碼幾乎純屬功能性目的，與本案複製之要點等書面文字不同；（2）該等案件之複製系基於「抄襲對競爭對手創新而言乃是不可或缺」此一前提，惟本案欠缺此必要性。

Bibas法官表示，Ross之所以利用係爭要點，僅是爲輕鬆開發出有競爭力之法律研究工具而已，此情況反倒較接近Warhol案[8]所分析：抄襲並非達成新利用目的之合理必要手段。因此，本項因素判斷繫有利於Thomson Reuters。

著作之本質

原則上，越具創意性之著作保護範圍越廣。儘管係爭要點符合原創性門檻，惟創意程度有限，故本項因素判斷繫有利於Ross。

所利用之質量及其佔整體著作之比例

在本案，本項因素之判斷關鍵在於「公衆接觸之質與量」（指是否成爲競爭性替代商品），而非「被告抄襲之質與量」，鑑於Ross向使用者提供之內容並未包含係爭要點，故本項因素判斷繫有利於Ross。

利用對於著作其潛在市場與現在價值之影響

原著作之市場爲「法律研究平臺」，以及著作人通常自行或授權他人開發之潛在衍生性市場，「法律AI工具之訓練資料」即是其一；於此前提下，Ross確實可能開發市場替代品以與Westlaw競爭，而非建立用途完全不同之新平臺。況且，Ross並未舉證反駁此等潛在市場不存在、或不受影響，故本項因素判斷繫有利於Thomson Reuters。

Bibas法官特別指出，本案情況與Google案不同，Sun Java API乃是程式設計師所熟悉慣用，Thomson Reuters所創作之要點或法律分類系統並無此特性，Ross大可自行創作或委託LegalEase爲其創作，並無侵害Thomson Reuters著作權並主張合理使用之必要。

結語

儘管本案只是美國聯邦地院層級之司法裁判，且未涉及目前最熱門之Gen AI，但其後續審理結果以及法院見解之擴散效應，相當值得關注；更遑論，Bibas法官本身即爲聯邦第三巡迴上訴法院之巡迴法官，其對於「中間複製」與「原著作潛在市場」之解釋及認定，確實可能影響Gen AI開發者主張合理使用之空間。上述案件分析亦可提供臺灣政府針對各種資料庫進行AI訓練、Gen AI的運用相關立法參酌。

備註：

責任編輯：盧頎

【本文僅反映專家作者意見，不代表本報立場。】

輔仁大學財經法律翻譯碩士學程

輔仁大學財經法律學系碩士

輔仁大學法律學系學士

法律資料涉及AI訓練資料庫之首件著作權侵權判決出爐：淺析Thomson Reuters v. Ross一案

相關資訊