臺灣要跟上主權AI 數發部次長:語料庫的建置希望民間一起投入
數發部常務次長葉寧(右二)今日出席立法院教育及文化、交通委員會聯席審查「人工智慧基本法草案」等案。記者季相儒/攝影
主權AI(人工智慧)是各國政府都很在意的議題,而展現主權AI之一的關鍵就是大語言模型。臺灣雖有在建置自己的語料庫,但目前的資料來源大部分來自政府內部,不同黨派的立委也很關注臺灣AI語料庫未來發展,數發部次長葉寧今日迴應,國科會先前已爲AI語料庫申請科專計劃4000萬元經費,目前語料庫資料主要來自政府,未來希望民間電子出版品廠商一起投入,讓臺灣出版品成爲語料庫的一部分。
全球瘋AI,臺灣雖然掌握到AI晶片商機,但是軟體層面仍高度仰賴國際業者Google、Meta、ChatGPT等。
民進黨立委李昆澤今日在立法院教育委員會上質詢時提出,如果臺灣連AI技術都高度仰賴國外,他擔心未來臺灣只是硬體供應者,臺灣恐難掌握AI產業主導權。
葉寧迴應,臺灣作爲國際產業鏈的一部分,也有匡列國發基金投資新創事業,而臺灣也有建立自己的主權語料庫,目前先從政府做起。而在AI模型的部分,國際公司已投入大量資本跟訓練成本,臺灣會在既有基礎上繼續發展自己的語料庫。
國民黨立委柯志恩則表示,在開發語料庫這個部分,誰擁有資料庫(Data Base),誰就擁有話語權,是否會影響主權中立,也需要考量,她認爲,在建構資料庫的過程中,要審慎處理。
國民黨立委葛如鈞指出,目前臺灣的語料庫都是政府單位資料,但是民間也有很多寶貴資料,他關注語料庫何時會開放給民間公司做AI訓練。
葉寧則迴應,目前民間電子出版品廠商也表現出高度興趣,希望電子出版品能夠成爲語料庫的一部分,他並表示,未來也希望民間可以一起來投入語料庫。