推主權AI 數發部三個月內釋出語料
打造臺灣主權AI語料庫,數發部第一階段先充實語言資料,預計二到三個月內會把語料釋出。圖/本報資料照片
立法院交通委員會18日邀請數發部針對「推動AI之產業發展政策」進行報告,其中打造臺灣主權AI語料庫部分,數發部迴應,6月開始找各部門盤點重要資料,第一階段先充實語言資料,預計二到三個月內會把語料釋出。
部長黃彥男表示,主權AI最重要就是資料品質,將來在《AI基本法》中也有很重要的部分就是資料治理。
對於語料庫進展,資料創新司司長莊明芬補充說,政府資料很豐富,像是文化、歷史、地理、動植物等,近期也在研擬語料庫行動計劃,6月已開始找各部會盤點重要語料庫,盤點完後搭配授權條款就會釋出,包括原民、客語等語言資料,也會納入。目前先進行基本訓練,未來二、三個月將一邊建置系統,一邊跟各部會討論,讓各部會知道如何進行,一起並進。
事實上,數發部本週也已預告「促進資料創新利用發展條例」,除由數發部訂定「資料創新利用發展基本計劃」,也放入「資料創新利用諮詢會」制度,希望完善資料共享。
不過立委質問,政院拋出AI新十大建設,數發部沒有被提及,是否邊緣化?
黃彥男表示,AI新十大建設還未報院,建設名稱可能還會調整,但數發部主辦兆元軟體平臺產業、智慧政府與資料治理兩個建設,另包括產業應用百萬家、全民智慧生活圈、智慧機器人、主權AI與算力、培育AI人才,以及區域均衡發展創造高產值高就業機會等六項協辦。
立委問數發部115年將編列多少預算執行AI相關業務,黃彥男透露,AI新十大建設是大建設,希望加碼160億元。不過立委質疑,若把數位產業算進AI產業發展,過去數發部相關預算僅編列5億元,現在暴增20倍,要求提出報告,還建議《AI基本法》中放入確保預算條文。
另外,立委還要黃彥男對推動業務自評,黃彥男認爲自己「70分」,但說原因是經費問題很多工作無法推動,立委則認爲只有「60分」有待加強。