科學人/簡立峰:臺灣擁有「看不見的AI」實力

圖/midjourney、shutterstock;設計合成/李婉琪

重點提要

在人工智慧(AI)浪潮席捲全球的今日,很難找到像簡立峰博士一樣,同時具備科學家的前瞻視野、企業家的實踐能力,以及對國家發展懷有濃厚情感的觀察者。他是臺灣第一位研究「語言模型」(language model)的博士,也曾擔任Google臺灣董事總經理長達14年。身處全球資訊科技巨擘的核心,他見證了AI從理論走向實踐的每一步。如今,退休後的簡立峰身兼數十家企業、法人機構的顧問,以一種前所未有的角色,試圖把他所預見的未來,傳達給國內有影響力的各界人士,轉化爲帶領檯灣前行的行動力。這一次的訪談,不是一位企業家的生涯回顧,或是經營一家科技公司的獨門心法,而是一場對臺灣的深刻預言,因此《科學人》特別把原訂的「我是企業家,也是科學人」專欄擴大篇幅爲「封面故事」,刊出完整的訪談內容,以期更多讀者可以從中獲得啓發與助益。

林大涵(以下稱林):許多人認爲AI是近幾年纔開啓的熱潮,但早在40年前你就已投身其中。能否帶我們聊聊1980年代的臺灣,在這個領域的研究氛圍是什麼樣子?

簡立峰(以下稱簡):說來或許令人驚訝,1985年我在臺灣大學念研究所時,臺灣學術界對AI的研究氛圍,甚至比現在還要狂熱。當時,AI被視爲下一個世代的重大科技,政府傾注了國家級資源,編列一億多元新臺幣的預算,準備發起一場由上而下的「造山運動」。臺大資工所特別針對AI的發展,派了八位教授前往美國史丹佛大學進修一年;暑期學校邀請來的講者,全都是國外的大學教授,講授最前沿的AI知識。那時候,整個臺大資工所的重心幾乎都轉向AI,從自然語言處理到電腦視覺,我們都懷抱着打造出人形機器人的美好理想。但是真正進入研究階段的時候就發現,理論與實際有落差,什麼研究方法都不懂,研究環境也沒有跟上國際水平,全部都得從無到有。

林:你是臺灣第一位研究語言模型的資訊博士,這個在ChatGPT時代人人皆知的名詞,在當時意味着什麼?

簡:在那個時代,「語言模型」還非常冷門,我的博士論文發表時,國際權威的電機電子工程師協會(IEEE)纔剛剛爲「自然語言處理」這領域創立專門的期刊,《IEEE音訊和語言處理學報》(IEEE Transactions on Audio and Speech Processing)。我的論文就刊登在它的1993年創刊第二期上,這足以說明當時這個領域有多麼新。畢業後我進入中央研究院,還有人問我,爲什麼要選擇這麼冷僻的題目?我的回答是:「就是因爲做不出來,才值得在中央研究院做。」這句話反映了當時的困境與挑戰,沒有現成的方法、沒有足夠的數據,一切都得自己摸索。如果當時有人告訴我,這個領域的突破要等上40年,我可能會選擇晚一點再投入。

林:你在Google的14年,正是AI從學術界走向產業界的關鍵時期。這段經歷如何形塑你對AI發展的核心觀點?

簡:加入Google是我職涯的關鍵轉捩點,它讓我從根本上理解「數據」的決定性力量。2006年我剛加入Google時,語言模型這個領域太新了,根本招聘不到人,所以我先從「Google翻譯」開始,我是這項專案的第四位科學家,也是唯一講中文的科學家,現在Google翻譯中文版的早期版本,就是我參與改進的。那時我的同事告訴我一個顛覆性的觀念:過去所有的理論,包含我們信以爲真的概念,都可能因爲數據量太少而無法驗證,等到哪天網際網路的資料足夠龐大的時候,一個相對簡單的方法就會應運而生,到時候只要餵給它足夠多的資料,其成效就能遠遠超越任何精巧的理論。這段話讓我領悟到,AI發展的瓶頸從來不是理論不夠好,而是資料量體不夠大。過去我們浪費了太多時間在沒有數據支持的理論上。從那一刻起我意識到,只要數據量持續增長,AI的進步將會越來越快,呈指數級成長。

林:ChatGPT讓世界爲之震撼,但你曾說它是「果」而非「因」。能否爲我們解析,是哪些關鍵的技術種子,促成這顆巨大的果實?

簡:的確,ChatGPT是過去十幾年技術積累的成果。其中最關鍵、但較不爲大衆所知的技術突破,第一項是在2013年前後成熟的「詞嵌入」(word embedding)技術。這個技術讓機器能夠理解詞彙的「語意」,而不僅是字面符號。例如,它能知道「大學」和「university」的語意幾乎一樣,即使它們本來出現在兩種完全不同的語言裡。這是分析地球上所有資料,找出詞彙共同出現的前後文(context)關係來實現的。

這裡有個關鍵,由於是從地球上的文本中尋找詞彙的相關程度,語意相近的文本組成的詞彙大同小異,因此可以把詞彙當做某種特徵,再利用一個七、八百維度的向量描繪這個特徵,經過「分羣」之後,利用神經網路訓練每一個特徵。

這種做法可以清楚地看到,在不同語言裡的某些詞彙向量幾乎共用相似的特徵,比對兩者就可以進行所謂的翻譯。今天的ChatGPT因爲把不同的語言優化在同一個向量空間裡,所以我們用繁體中文輸入訊息,經過它轉譯成向量,再從向量空間比對語意,就能獲取其他語言在網路上能找到的文字訊息。這項方便的技術,是非常傑出的成就。

第二項更關鍵的突破,是2017年Google在深度學習轉換模型(transformer)中提出的「注意力」(attention)。「詞嵌入」處理了「詞彙」層級的語意,「注意力」則解決了「句子和篇章」層級的長距離依賴關係,讓AI模型能理解文章開頭的某個詞彙如何影響結尾。這兩項技術的結合,賦予AI具備深度理解和生成語言的能力,最終催生了大型語言模型(LLM),而ChatGPT只是其中的一例。

林:可以爲我們說明通用人工智慧(AGI)的五個階段,以及我們目前處在什麼階段嗎?

簡:這是OpenAI提出的框架,我認爲它非常清晰地勾勒出AI的演進路徑。

第一階段:聊天機器人(chatbot)。在這個階段的AI能與人流暢地對話,目前已經能實現。

第二階段:推理者(reasoner)。AI不僅是給出即時反應,而是開始具備「思考」和規劃的能力。它會「想一想再回答」,讓回答的品質大幅提升。

第三階段:代理人(agent)。這是當前的階段。能夠推理的AI已經很優秀了,但是還不夠好,原因是大多數使用者雖然會問問題,AI會給你幾個參考,但需要人類自己去執行。ChatGPT全球風行的這幾年,因ChatGPT而付諸行動、最終實際受益的用戶,大約只有兩億人。在代理的層級,AI從「提供答案」(answer)進化到「採取行動」(action),例如「幫我訂一張去東京最便宜的機票」,它就會自主完成所有查詢、比價、甚至下訂。

第四階段:創新者(innovator)。在這個階段,AI將能解決頂尖專家都無法解決的問題,例如AlphaFold預測蛋白質結構,加速新藥研發,這已經是人類無法達成的創新。還有一個自動化研究助理叫AlphaEvolve,它是透過基因演算法(genetic algorithm, GA),你給它一個要解決的題目之後,它會「想盡辦法」解開它。「想盡辦法」的概念非常關鍵,當想法越來越深入,一次比一次更好,一旦突破了某個臨界點,人類最終會望塵莫及。

第五階段:組織層級決策者(organizational decision-maker)。這是最高階段的人工智慧,這時的AI具備運籌帷幄、進行復雜戰略決策的能力,足以影響組織甚至國家的走向。

林:你特別強調「代理人」(agent)是下一波顛覆的開始,這將會如何重塑商業世界與日常生活?

簡:「代理人」的崛起,意味着所有以「中介服務」爲核心的商業模式都面臨存亡危機。過去,我們透過房仲平臺、旅遊或電子商務網站完成交易,而這些平臺賺取流量帶來的廣告費或佣金。未來,你的AI代理人將直接跳過這些平臺,爲你找到最佳方案並完成交易。例如,它會直接跟航空公司或飯店系統對接,爲你拿到最好的價格。意味着商業模式將從點擊廣告轉變爲由代理人完成後的「交易抽成」。這會導致網路交易結構性改變,從由人類瀏覽的「Web」,變成由AI代理人相互溝通的「agentic Web」。所有交易模式都會改變,寫程式的軟體產業、做研究的研發部門或是學術界都會改變。講白一點,所有的白領階級都會經歷改變。

林:若AI能理解語言,還能自主行動成爲固定流程的代理人,AI在國際局勢中將扮演什麼樣的角色?

簡:AI,特別是AGI,已經成爲當今美中科技冷戰中的政治籌碼,如同過去冷戰時期的「核子武器」。這是一場動搖國本的國家級競賽。誰先掌握能夠進行自主創新和戰略決策的AGI,誰就取得了戰略上的絕對優勢。而且,我們可以預見,一旦某個國家達到了這個階段,這項頂尖技術就不可能再開源(open source),而會成爲嚴格管制的國家級戰略資產,就像核技術一樣。這也是爲什麼我們看到美國對中國的晶片禁令如此嚴厲,因爲這場賽局,賭的是未來數十年的全球領導地位。

林:在這場全球AI競賽中,你認爲臺灣最獨特、最關鍵的優勢是什麼?

簡:臺灣擁有「看不見的AI」(invisible AI)實力。全世界都在談論演算法及其應用,但所有AI運算都必須運行在硬體之上。臺灣掌握了這個金字塔最底層、卻也最堅實的基礎,那就是全球最先進的半導體制造能力。輝達(Nvidia)的黃仁勳、超微半導體(AMD)的蘇姿豐都需要臺灣,全世界AI的發展都依賴臺灣的晶片,而這個看不見的AI實力正是美國缺少的,不是中國缺的!中國從來不缺晶片,只是他們的晶片製造技術慢臺積電幾個世代。然而對美國而言,美國有設計能力,但是缺乏製造生態系,美國喊中國缺晶片,是在掩飾自己缺晶片的事實。因此,臺灣在這場賽局中,扮演了無可取代的關鍵角色。

林:臺積電從「臺灣製造」走向「世界製造」,這對臺灣的未來是危機還是轉機?

簡:絕對是轉機。我認爲這是臺灣解決自身發展困境的唯一出路。臺灣面臨水、電、土地、人才、勞工的「五缺」問題,單靠島內資源已無法支撐產業的持續擴張。臺積電的全球佈局,能讓臺灣產業升級,實現「研發在臺,遠距管理,世界製造」。我們可以把高耗能、高耗水的製造環節移往海外,而價值最高的研發、設計與管理中樞留在臺灣。透過AI和軟體工具的配合,工程師可以在臺灣遠端操控美國亞利桑那或德國德勒斯登的工廠。這將澈底改變臺灣的製造業,讓臺灣從一個硬體的生產基地,轉型爲全球高科技製造的「大腦」和「管理者」。

我認爲,唯獨臺積電變成世界的臺積電,纔可以救自己,也纔可能救臺灣。全球前500大企業沒有一家企業能堅持只用自己國家的人才。日本曾經有高達200家企業進入全球前500大企業,現在剩32家;前100大隻剩豐田汽車(Toyota),等到美日關稅簽下去,豐田汽車賣不動,日本可能就一家也沒有了。五年前,臺灣沒有一家公司位列全球市值500大企業,現在有臺積電、聯發科、鴻海三家。所以說,臺灣在無形中變大了,但無形之中變大的這些企業,如果只用臺灣人,隨着出生率下降,你可想見20年後這些企業的員工只能從10萬人裡頭去挑,最後勉勉強強只能挑出100人,那這些企業的未來在哪裡?

我曾經非常擔心臺積電,我跟高層建議過要向韓國三星學習,三星有50%的員工不是韓國人。而現在是多麼好的年代,只要戴着藍牙耳機,就算所有人都講各自的母語,透過AI即時翻譯也可以溝通。這是30年前日本沒遇上的機緣,所以現在大可放心讓企業好好的往外走。

我最近在整理一個「1:99」的概念,AI會極大化地放大領先者的優勢。前1%掌握頂尖AI技術的國家、企業與個人,其生產力與創造力將遠遠甩開其他99%。這不僅體現在個人財富上,更體現在國家實力上。未來可能不再有「500大企業」,而是隻剩下「100大」或「10大」企業。同樣地,全球200個國家中,可能只有少數幾個國家能在AI賽局中勝出,其餘將淪爲「平庸國家」。這將加劇全球的不平等,是我們必須嚴肅面對的課題。

林:你退休後擔任超過數十家企業與法人機構的顧問,橫跨新創到產業龍頭。是什麼樣的觀察與情懷,驅使你從一個全球科技人的高度,重新投入並剖析臺灣在全球變局中的處境與未來?

簡:退休時我發現,在世界的科技新創地圖上,竟然沒有臺灣。我們自稱「科技島」,但2010 ~ 2020年間,當全世界都在談論創新時,臺灣卻是缺席的。我在Google內部提案的時候切身感受到這種處境,當時我想把臺灣列爲一個有新創潛力的據點,但幾乎沒有人願意相信。那個時代的趨勢是「大膽西進」,大量的資金與人才都流向了中國。我看着國際上的獨角獸(unicorn,指成立不到10年,但估值超過10億美元,且股票尚未上市的科技新創公司)名單,越南、菲律賓都有好幾家,而臺灣是零。我那時的想法就是,臺灣不能只是零,一定要有一隻獨角獸,但是直到目前還是沒有,因爲沛星互動科技(Appier)這家公司後來選擇在日本上市,被算在日本的獨角獸名單裡。

但是臺灣真的沒有一家獨角獸企業嗎?這背後有一些結構性的因素,真正的問題在於「素人創業」的艱難。臺灣的創新模式很特別,我們的獨角獸來自於大企業的內部孵化(spin-off),例如聯發科旗下的達發、緯創集團的緯穎。這些由大集團支持的新創,一上市就有千億市值。但這也凸顯了一個困境:當一個產業由一家獨大時,就很難有新創公司出頭。這是在小國必然會發生的現象。

我在Google工作的經驗,讓我習慣用「國與國的尺度」來思考問題。我曾讀過一本書,分析小國如何成爲科技大國,結論是:小國必須依附大國,將其做爲自己的市場。例如以色列依附美國、愛爾蘭依附英國、芬蘭依附俄羅斯。過去臺灣依附中國市場,這就帶來了最根本的戰略難題:當中國不能當成市場時,我們幾乎一無所有。 更麻煩的是,我們不像韓國,進去中國之後還能全身而退;因爲文化的親近,導致臺灣的產業一旦深入中國,就很難抽離。

然而,一個意想不到的轉捩點出現了,那就是「川普1.0」救了臺灣。他發動的貿易戰,一刀切斷「紅色供應鏈」,我們被迫從紅色供應鏈中脫離,轉而成爲「美系供應鏈」不可或缺的一環,這對臺灣而言是個意外的轉機。

一個事實是,臺灣在中國製造的產品,並不是爲了中國的內需,主要客戶其實是美國。所以當供應鏈必須選邊站時,我們是有能力「拔開」的。這個外部的巨大推力,加上COVID-19疫情,促成一波巨大的臺資回臺浪潮。以這幾年臺灣股市的榮景來說,臺北股市現在是世界前十大股市,大約是德國股市的大小,國民所得也超越日本,跟韓國在伯仲之間,都與這個全球供應鏈的重組有直接關係,如果往回看三、四年前,這是完全無法想像的局面。

但故事還沒結束。當我們以爲一切都走向美好時,新的挑戰又來了。美國幫你把敵人「劃清界線」之後,下一步可能就是瞄準你的核心優勢。我們現在面臨「臺積電變美積電」的壓力,這不是產業問題,而是國家層級的賽局。

林:你如何定位自己現在的角色?

簡:我很幸運同時受過科學及產業的訓練。我有地球尺度的軟體經驗,Google 讓我的能力變深、變大,在臺灣的跨領域經驗讓我的能力變寬。我也算是研究語言模型的老一輩,對於AI能力的預測,可以看得更長遠也更精準,因此經常受邀參與政府決策、企業決策,也投身社會公益。

我把自己定位爲一個「B2B的影響者」。我的目標不是對大衆(B2C)宣傳,而是把我從全球視角觀察到的趨勢與洞察,直接傳達給那些真正能影響臺灣未來的決策者,包括上市櫃公司的董事長、政府高層等。我覺得AI是動搖國本、撼動企業的事情,對於臺灣現在的處境,身處高位的領導者最有感、也最焦慮。我的工作就是把複雜的未來情勢,用他們能理解的語言,轉化爲具體的思考策略,讓他們先做好準備。我保持中立,不帶色彩,純粹傳播知識,希望能幫助他們在變局中做出正確的判斷。

林:你不斷強調,你的角色是幫助他人,這似乎是你的動力與熱情源源不絕的來源?

簡:我想是的。我發現,唯一能讓人長久保持熱情的方式,就是去幫助別人。如果你只是在做自己的事,很快就會感到無聊。當我投入每一場會議,我都是全心全意地去理解對方的問題,並貢獻我的想法。這個過程本身就充滿了學習與回饋。反過來說,那些有影響力的人也影響了我,他們提出的問題,讓我看到了我原本不知道的世界。這是一種相互成就的過程。

林:你的一天是什麼樣子?你如何管理如此龐雜的資訊與橫跨多領域的顧問工作?

簡:我的核心策略是將自己的時間「極大化」。因此我幾乎所有的會議都在線上進行,因爲一場實體會議的時間成本,相當於三至四場線上會議。線上的方式讓我在一天之內,可以參與八場不同的會議。我的行程都不是由我主動安排的,而是由外部的需求來決定。我的模式是「別人出題,我幫忙想」,我提供我的觀點與分析,但不干涉後續的執行。這讓我能持續接觸到不同領域,最多元、最前沿的問題,我就像一個不斷被訓練的ChatGPT,再將學習到的洞察,回饋給下一個需要的人,形成一個知識的正向循環。

林:AI的學習能力如此強大,但它是否有其根本的限制?人類還剩下哪些無法被輕易取代的價值?

簡:AI有其根本性的限制,目前它掌握的所有知識都來自於被語言或符號編碼過的數位資料。也就是說,它缺乏對「物理世界」的直觀理解。一個兩歲的小孩知道斜坡上的球可能會滾下來,知道沸水會燙傷,知道玻璃會刺人,這些是透過與物理世界互動而學到的知識,但AI沒有這些經驗。

更深一層來說,AI缺乏那些無法言傳的「視覺知識」。一位經驗老到的水電師傅看一眼就能判斷管線哪裡出問題,這種透過視覺經驗而來的知識,是無法寫成書或文字讓AI學習的。我們還不知道要怎麼把非語言的知識教給AI,如今最需要突破的是「視覺學習」,現在全世界的人形機器人,可能都在看YouTube!

許多人面對AI的發展,會產生很多擔憂,但我不覺得這一次AI浪潮比工業革命更嚴重。現在所有人都看得到世界正在改變,而工業革命只有少數人知道當時的世界發生什麼事,很多人並不知道正要經歷一場世紀大變。此外,我們必須小心「大腦外包」的風險。當答案能輕易從AI取得時,人類可能會停止獨立思考。未來世界所需要的人才,除了專業深度,還具備跨領域整合、溝通協作與解決複雜問題的能力。單一技能很容易被AI取代,如何整合不同領域的知識,併發揮創造力,是人類的核心競爭力。

最後,也是最重要的一點,是「人的陪伴」。AI可以提供無盡的知識與解答,但它無法在一個人生命中最脆弱的時刻,給予真實的溫暖與慰藉。就像法鼓山的法師在信徒臨終時的陪伴,那種人與人之間真實的情感連結、心理上的安定感,是AI永遠無法取代的。所以爲什麼宗教界會需要蓋教堂或是廟宇,因爲這些空間能夠營造出一種沉浸感(immersion)。AI時代下,人與人之間的關係將會重新定義,人類與AI的關係會找到新的平衡,人還有很多價值,沒那麼容易取代。

精采訪談,請上《科學人》官網 「影音專區」

(本文出自2025.09.01《科學人》網站,未經同意禁止轉載。)