☰

臺灣要跟上主權AI 數發部次長：語料庫的建置希望民間一起投入

數發部常務次長葉寧（右二）今日出席立法院教育及文化、交通委員會聯席審查「人工智慧基本法草案」等案。記者季相儒／攝影

主權AI（人工智慧）是各國政府都很在意的議題，而展現主權AI之一的關鍵就是大語言模型。臺灣雖有在建置自己的語料庫，但目前的資料來源大部分來自政府內部，不同黨派的立委也很關注臺灣AI語料庫未來發展，數發部次長葉寧今日迴應，國科會先前已爲AI語料庫申請科專計劃4000萬元經費，目前語料庫資料主要來自政府，未來希望民間電子出版品廠商一起投入，讓臺灣出版品成爲語料庫的一部分。

全球瘋AI，臺灣雖然掌握到AI晶片商機，但是軟體層面仍高度仰賴國際業者Google、Meta、ChatGPT等。

民進黨立委李昆澤今日在立法院教育委員會上質詢時提出，如果臺灣連AI技術都高度仰賴國外，他擔心未來臺灣只是硬體供應者，臺灣恐難掌握AI產業主導權。

葉寧迴應，臺灣作爲國際產業鏈的一部分，也有匡列國發基金投資新創事業，而臺灣也有建立自己的主權語料庫，目前先從政府做起。而在AI模型的部分，國際公司已投入大量資本跟訓練成本，臺灣會在既有基礎上繼續發展自己的語料庫。

國民黨立委柯志恩則表示，在開發語料庫這個部分，誰擁有資料庫（Data Base），誰就擁有話語權，是否會影響主權中立，也需要考量，她認爲，在建構資料庫的過程中，要審慎處理。

國民黨立委葛如鈞指出，目前臺灣的語料庫都是政府單位資料，但是民間也有很多寶貴資料，他關注語料庫何時會開放給民間公司做AI訓練。

葉寧則迴應，目前民間電子出版品廠商也表現出高度興趣，希望電子出版品能夠成爲語料庫的一部分，他並表示，未來也希望民間可以一起來投入語料庫。

臺灣要跟上主權AI 數發部次長：語料庫的建置希望民間一起投入

相關資訊